WordNet est une base de données de mots super cool. J'ai fait des recherches moi-même. Je vais énumérer mes conclusions ci-dessous - et j'espère que cela vous aidera à mieux comprendre les tableaux.
Le tableau Synset La table des synsets est l'une des tables les plus importantes de la base de données. Il est responsable du logement de toutes les définitions dans WordNet. Chaque ligne de la table synset a un synsetid, une définition, un pos (parties du champ de la parole) et un lexdomainid (qui renvoie à la table lexdomain) Il y a 117373 synsets dans la base de données WordNet.
Le tableau des mots WordNet a également une table "words", qui n'a que deux champs :un wordid et un "lemma". La table des mots est responsable du logement de tous les lemmes (mots de base) dans la base de données Wordnet. Il y a 146625 entrées dans cette table
Alors .. comment ces deux tables sont-elles liées? La réponse? La table des sens !
La table des sens La table de sens est responsable de la liaison des mots (dans la table des mots) avec les définitions (dans la table des synsets). est un sens complet d'un mot - un "sens du mot".
Il y a un total de 206 354 sens de mots dans la base de données WordNet.
Le tableau Lexdomains La table Lexdomains est référencée par la table de sens et est utilisée pour définir à quel domaine lexical appartient une paire mot-sens. Il y a 45 domaines lexicaux dans la table lexdomains. La table lexdomain est donc la manière de WordNet de « taguer » une paire mot-sens. Cependant, elle est assez limitée, car un couple mot-sens ne peut appartenir qu'à UN SEUL domaine lexical.
Les 45 domaines lexicaux incluent :
Adjectifs : tout, pert
Adverbes tout
Noms Hauts, acte, animal, artefact, attribut, corps, cognition, communication, événement, sentiment, nourriture, groupe, emplacement, motif, objet, personne, phénomène, plante, possession, processus, quantité, linkdef, forme, état, substance, temps,
Verbes corps, changement, cognition, communication, compétition, consommation, contact, création, émotion, mouvement, perception, possession, social, statique, météo, ppl
Le tableau casedwords Certains mots dans le tableau des mots ont naturellement la première lettre en majuscule, c'est-à-dire :"A-team". Étant donné que la table des mots stocke tous les mots en minuscules, WordNet utilise cette table pour spécifier la version majuscule du mot. Il y a 40313 entrées dans cette table.
Il existe de nombreux autres tableaux dans la base de données WordNet, une fois que je les aurai recherchés, je les publierai à nouveau.
Trouver vos synonymes Pour répondre à votre question concernant les synonymes - Vous devez procéder comme suit.
Disons que vous voulez trouver les synonymes du mot "Carry". Pour ce faire, vous devez d'abord rechercher dans le tableau des mots un lemme correspondant au mot "porter". Cela donnerait le wordid 21253. Vous chercheriez alors dans la table des sens, pour trouver toutes les paires mot-sens pour le mot carry. Cela donne 41 résultats - chaque résultat répertorie le wordid 21253, et un senseid (qui est l'index de la paire mot-sens) et un synsetid.
Maintenant, vous devrez alors interroger la table synset pour chacun des synsetid renvoyés afin de pouvoir accéder au champ de définition associé dans la table synset.
Enfin, pour trouver les synonymes de chacun des synsets répertoriés, il vous suffirait de rechercher dans la table des sens d'autres paires de sens partageant le même synset.
Exemple :L'une des 41 paires de mots-sens pour le mot "porter" est répertoriée ci-dessous :Si nous recherchons la définition de ce synsetid 202083512, vous trouverez "transmettre ou servir de support de transmission"
Pour trouver tous les synonymes de cette définition, vous devez ensuite rechercher dans la table des sens le même synsetid 202083512. Cela donne des synonymes :canal, conduite, transmission, transmission et transmission (remarque :vous devrez joindre à gauche la table des mots pour obtenir les vrais lemmes)
J'espère que cela vous aidera à démystifier WordNet.. Je trouve ça plutôt cool...