Résumé de section

    • Exercice: slides part II - 36-37 :
      • Utilisez Genie pour générer plusieurs datasets à partir du réseau Sachs, par exemple 5 fichiers de taille 50, 100, 250, 500.
      • pour chaque fichier de données, vous allez utiliser l'algorithme GTT fourni par Genie (même famille que le Greedy Search vu en cours).
      • questions :
        1. pour une taille de données fixée, pourquoi répète-t-on plusieurs fois l'expérience ?
        2. pour une expérience, comment comparer le graphe "théorique" utilisé pour générer les données et celui appris, pour évaluer l'efficacité de l'algorithme d'apprentissage ? pouvez-vous expliquer pourquoi il est dangereux de comparer directement les DAG ? et pourquoi comparer les CPDAG aurait plus de sens ?
        3. montrez à l'aide de vos expériences si l'apprentissage s'améliore lorsque la taille des données augmente.