Bonsoir
Je suis en passe de concrétiser un projet sur lequel je travaille disons... depuis un certain temps :mrgreen: et qui met en oeuvre un certain nombre de relations entre les mots que comportera la base de données (ces "mots" ou expressions clé permettront la classification de photographies)
Le principe de mon projet repose non pas sur des thésaurus pré mâchés comme on en trouve sur le net (et ne collant pas forcément aux besoins réels de l'utilisateur) mais à une construction au fil du temps par l'utilisateur / administrateur (il n'est pas question d'aborder ici la méthodologie : l'utilisateur ce sera moi, en tout cas dans un premier temps
)
Parmi les relations prévues :
- synonymes
- hypéronymes (ce qui correspond à une hiérarchie : "mammifère / ongulé / suidé / sanglier" par exemple, "mammifère" est un hypéronyme d'ongulé, qui est lui-même hypéronyme de suidé, etc.)
- holonymes (principe légèrement différent en ce sens que la hiérarchie fonctionne par partitionnement physique : sanglier est holonyme de groin, ou poisson est holonyme d'écaille, par exemple)
- homonymes (seront gérés certainement de manière automatique par un algorithme soundex... à voir ce que ça donne sachant que la BDD sera bilingue !)
Seulement voilà, j'ai comme le sentiment que j'oublie des choses. Comment gérer aux mieux les singuliers / pluriels / genres / variantes d'âges ou je ne sais quoi encore ?
Par exemple : chevreuil, brocard (mâle), chevrette (femelle), chevrillard (jeune de plus de 6 mois), faon (jeune de moins de 6 mois), etc.
Ce sont des synonymes, mais qui ont une relation spécifique entre eux et un degré de synonymie si j'ose dire qui est différent.
Dans mon schéma, les mots sont liés entre eux par :
- hypéronymie
- holonymie
- synonymie (avec une importance de 1 à 5, 5 étant un parfait synonyme, 1 étant un synonyme "plus éloigné" ; je n'ai pas forcément le besoin de matérialiser la relation parent/enfant par exemple, il faut juste que je sache que "faon" est "moins synonyme" que "chevrette" pour un "chevreuil")
- relation phonétique (homonymes)
Ajoutons là-dessus une non correspondance systématique d'une langue à une autre :twisted: (en anglais, sauf erreur de ma part il n'y a pas de traduction pour "brocard", le chevreuil mâle !), j'en passe et des meilleures !
Enfin, j'aimerais ajouter des couplages de mots comme "chevreuil femelle" qui est synonyme de "chevrette" ! Dois-je en rajouter une couche, ou dois-je considérer "chevreuil femelle" comme un mot informatiquement parlant ? (sachant que si oui, il faudra aussi considérer son inverse : "femelle chevreuil" !)
Est-ce que certains d'entre vous ont déjà travaillé sur ce type de projet ? Je recherche éventuellement des exemples...
Je suis en passe de concrétiser un projet sur lequel je travaille disons... depuis un certain temps :mrgreen: et qui met en oeuvre un certain nombre de relations entre les mots que comportera la base de données (ces "mots" ou expressions clé permettront la classification de photographies)
Le principe de mon projet repose non pas sur des thésaurus pré mâchés comme on en trouve sur le net (et ne collant pas forcément aux besoins réels de l'utilisateur) mais à une construction au fil du temps par l'utilisateur / administrateur (il n'est pas question d'aborder ici la méthodologie : l'utilisateur ce sera moi, en tout cas dans un premier temps

Parmi les relations prévues :
- synonymes
- hypéronymes (ce qui correspond à une hiérarchie : "mammifère / ongulé / suidé / sanglier" par exemple, "mammifère" est un hypéronyme d'ongulé, qui est lui-même hypéronyme de suidé, etc.)
- holonymes (principe légèrement différent en ce sens que la hiérarchie fonctionne par partitionnement physique : sanglier est holonyme de groin, ou poisson est holonyme d'écaille, par exemple)
- homonymes (seront gérés certainement de manière automatique par un algorithme soundex... à voir ce que ça donne sachant que la BDD sera bilingue !)
Seulement voilà, j'ai comme le sentiment que j'oublie des choses. Comment gérer aux mieux les singuliers / pluriels / genres / variantes d'âges ou je ne sais quoi encore ?
Par exemple : chevreuil, brocard (mâle), chevrette (femelle), chevrillard (jeune de plus de 6 mois), faon (jeune de moins de 6 mois), etc.
Ce sont des synonymes, mais qui ont une relation spécifique entre eux et un degré de synonymie si j'ose dire qui est différent.
Dans mon schéma, les mots sont liés entre eux par :
- hypéronymie
- holonymie
- synonymie (avec une importance de 1 à 5, 5 étant un parfait synonyme, 1 étant un synonyme "plus éloigné" ; je n'ai pas forcément le besoin de matérialiser la relation parent/enfant par exemple, il faut juste que je sache que "faon" est "moins synonyme" que "chevrette" pour un "chevreuil")
- relation phonétique (homonymes)
Ajoutons là-dessus une non correspondance systématique d'une langue à une autre :twisted: (en anglais, sauf erreur de ma part il n'y a pas de traduction pour "brocard", le chevreuil mâle !), j'en passe et des meilleures !
Enfin, j'aimerais ajouter des couplages de mots comme "chevreuil femelle" qui est synonyme de "chevrette" ! Dois-je en rajouter une couche, ou dois-je considérer "chevreuil femelle" comme un mot informatiquement parlant ? (sachant que si oui, il faudra aussi considérer son inverse : "femelle chevreuil" !)
Est-ce que certains d'entre vous ont déjà travaillé sur ce type de projet ? Je recherche éventuellement des exemples...