Analyse
Ce qu'a observé le jury
Synthèse Hadamard du rapport officiel — citations, chiffres et conseils du jury.
Présentation du sujet
Sujet OCaml 2026 sur les bases de données de vecteurs (cas d'usage : reconnaissance musicale, similarité d'embeddings IA). 3 parties indépendantes. Partie I : vecteurs de bits — similarité par bits en commun, application à la reconnaissance automatique d'extraits musicaux. Partie II : listes à sauts (skip-list) avec pointeurs multi-étages pour recherche efficace, et plus proches voisins dans graphes hiérarchiques avec voisinage à plusieurs étages. Partie III : approximation…
Structure de l'épreuve
- Partie I — Partie I — Vecteurs de bits et reconnaissance musicale(—)Niveau attendu
Bases de données de vecteurs de bits. Similarité = nombre de bits en commun. Application à la reconnaissance automatique d'extraits musicaux (fingerprinting).
- Partie II — Partie II — Listes à sauts et graphes hiérarchiques(—)Difficile
Structure de données 'liste à sauts' (skip-list) avec pointeurs à plusieurs étages pour accélérer la recherche. Recherche de plus proches voisins dans des graphes hiérarchiques où chaque nœud correspond à un vecteur, voisinage défini à plusieurs étages.
- Partie III — Partie III — Approximation distance euclidienne via k-moyennes(—)Très difficile
Approximation de f(x,y)=‖x−y‖ entre deux vecteurs en plongeant ces vecteurs dans un espace discret de plus petite dimension : ℝ^d → {0,…,k−1}^m avec m<d, via l'algorithme des k-moyennes (k-means). Quantification vectorielle.
Chapitres clés à maîtriser
Ressources
Téléchargements
Sujet officiel, corrigé Hadamard et rapport jury — tout en un endroit.
FAQ

