Bases & syntaxe
from sklearn import datasets, svm, metrics
Importer les modules Scikit-learn
Structures de données
iris = datasets.load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
Charger et diviser un jeu de données
Fonctions & méthodes essentielles
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
Former et prédire avec un modèle
Patterns courants
from sklearn.pipeline import Pipeline
pipe = Pipeline([('classifier', svm.SVC())])
pipe.fit(X_train, y_train)
y_pred = pipe.predict(X_test)
Utiliser des pipelines pour simplifier la création de modèles complexes
Opérations avancées
grid_search = GridSearchCV(svm.SVC(), param_grid={'C': [1, 10], 'gamma': [1, 0.1]}, cv=5)
grid_search.fit(X_train, y_train)
print(grid_search.best_params_)
Optimiser les hyperparamètres avec une recherche exhaustive
Debugging & outils
from sklearn.metrics import classification_report
print(classification_report(y_test, y_pred))
Évaluer la performance d'un modèle avec des rapports de classification