European Case Law Identifier: | ECLI:EP:BA:2006:T131804.20060808 | ||||||||
---|---|---|---|---|---|---|---|---|---|
Date de la décision : | 08 Août 2006 | ||||||||
Numéro de l'affaire : | T 1318/04 | ||||||||
Numéro de la demande : | 98402371.3 | ||||||||
Classe de la CIB : | G10L 5/06 | ||||||||
Langue de la procédure : | FR | ||||||||
Distribution : | C | ||||||||
Téléchargement et informations complémentaires : |
|
||||||||
Titre de la demande : | Procédé d'apprentissage dans un système de reconnaissance de parole | ||||||||
Nom du demandeur : | NORTEL NETWORKS France | ||||||||
Nom de l'opposant : | - | ||||||||
Chambre : | 3.4.01 | ||||||||
Sommaire : | - | ||||||||
Dispositions juridiques pertinentes : |
|
||||||||
Mot-clé : | Nouveauté (non; requête principale et requête subsidiaire | ||||||||
Exergue : |
- |
||||||||
Décisions citées : |
|
||||||||
Décisions dans lesquelles la présente décision est citée : |
|
Exposé des faits et conclusions
I. Le présent recours est dirigé contre la décision de la division d'examen, remise à la poste le 24 juin 2004, rejetant la demande de brevet européen numéro 98 402 371.3.
Le recours a été déposé le 25 août 2004, et la taxe de recours a été acquittée le 30 août 2004. Le mémoire exposant les motifs du recours a été reçu le 26 octobre 2004.
II. La demande a été rejetée inter alia pour manque de nouveauté en application des articles 52(1), 54(1) et (2) CBE par rapport à l'enseignement du document :
D1 : EP-A-0 762 709.
III. Suite à une requête correspondante, le requérant a été dûment invité à comparaître à une procédure orale le 8 août 2006 conformément à la règle 71(1) CBE.
Dans une notification envoyée le 11 juillet 2006 en vue de préparer la procédure orale, la Chambre de recours, en se basant sur le raisonnement de la division d'examen dans la décision contestée, a exprimé des doutes inter alia quant à la nouveauté de l'objet de la revendication 1 en litige. En plus, la Chambre a émis l'avis provisoire selon lequel les arguments avancés dans le mémoire exposant les motifs du recours n'étaient pas convaincants.
IV. En réponse, le requérant a indiqué par lettre en date du 21 juillet 2006 qu'il retirait sa requête en procédure orale et qu'il ne serait pas représenté à la procédure orale. En même temps il a répondu à l'avis provisoire de la Chambre et a soumis des nouvelles versions d'une revendication 1 selon une requête principale et une requête subsidiaire, respectivement.
Le requérant a demandé par écrit l'annulation de la décision de rejet et la délivrance du brevet sur la base de deux jeux de revendications 1 à 9 selon une requête principale et une requête subsidiaire, comprenant respectivement une desdites versions de la revendication 1 déposée par lettre du 21 juillet 2006 et les revendications 2 à 9 dans la version initiale.
V. La procédure orale a eu lieu devant la Chambre le 8 août 2006 en l'absence du requérant.
VI. La revendication 1 de la requête principale s'énonce comme suit :
" 1. Procédé d'apprentissage, pour un système de reconnaissance de parole mettant en oeuvre des tests de reconnaissance à l'aide d'un dictionnaire de références (11) où sont mémorisés des jeux de paramètres respectivement associés à des références, chaque test de reconnaissance comprenant l'identification d'au moins un jeu de paramètres qui, parmi les jeux de paramètres mémorisés dans le dictionnaire, correspond avec une vraisemblance maximale à un segment de parole fourni au système, le procédé d'apprentissage comprenant, pour un jeu de paramètres à mémoriser dans le dictionnaire en association avec une référence, l'obtention de plusieurs segments de parole successivement prononcés par un locuteur et le traitement de ces segments de parole pour estimer ledit jeu de paramètres,
ledit traitement des segments de parole comprenant les étapes suivantes :
/a/ on estime une version provisoire dudit jeu de paramètres sur la base d'au moins un des segments de parole ;
/b/ on mémorise ladite version provisoire dans le dictionnaire en association avec la référence,
caractérisé en ce que ledit traitement des segments de parole comprend en outre l'étape suivante :
/c/ on soumet au moins un des segments de parole à un test de reconnaissance, et on modifie la version provisoire mémorisée d'une manière dépendante du fait que ce test de reconnaissance identifie ou non ladite version provisoire."
Les revendications 2 à 9 sont des revendications dépendantes.
La requête subsidiaire ne diffère de la requête principale que par la suppression de l'expression "au moins" dans la phrase "l'identification d'au moins un jeu de paramètres" de la revendication 1.
VII. Par écrit, le requérant a soutenu qu'il était douteux selon l'interprétation que l'on donne de la caractéristique /b/, que le procédé d'apprentissage connu du document D1 puisse comprendre cette étape. En tout état de cause, pour le procédé connu, nulle part il n'était question de faire un test de reconnaissance en utilisant l'ensemble du dictionnaire tel que défini par la caractéristique /c/ en combinaison avec la préambule de la revendication 1.
Motifs de la décision
1. Le recours a été formé en bonne et due forme et dans les délais prévus par la CBE. Il est donc recevable.
2. Le document D1 divulgue un procédé d'apprentissage d'un nouveau segment de parole (spécifiquement d'un nouveau nom), pour un système de reconnaissance de parole mettant en oeuvre des tests de reconnaissance à l'aide d'un dictionnaire de références où sont mémorisés des jeux de paramètres ("templates" selon la terminologie de D1) respectivement associés à des références (figures 1, 2, 4, 5 et 7 à 9 avec la description correspondante). Dans ce contexte, il est implicite pour l'homme du métier que le procédé d'apprentissage connu est apte à être appliqué pour un système de reconnaissance dont chaque test de reconnaissance comprend l'identification d'au moins un jeu de paramètres qui, parmi les jeux de paramètres mémorisés dans le dictionnaire, correspond avec une vraisemblance maximale à un segment de parole fourni au système, même si D1 ne spécifie explicitement pas les détails mathématiques des tests de reconnaissance du système de reconnaissance. Comme le requérant a observé lui-même dans son mémoire de recours, l'usage d'algorithmes à maximum de vraisemblance est très répandu pour effectuer des tests de reconnaissance dans le domaine de la reconnaissance de parole.
En ce qui concerne l'étape /a/ des revendications 1, le document D1 divulgue que l'apprentissage d'un nouveau nom (segment de parole) dans le dictionnaire commence avec une première prononciation dudit nom par un locuteur. Si le nouveau nom ne fait pas encore partie des jeux de paramètres et références associées du dictionnaire, une version provisoire du jeu de paramètres est mémorisé, correspondant à l'étape /a/, dans une partie du dictionnaire comprenant des modèles de rejet ("garbage models") (figures 5 et 7 ; colonne 7, lignes 7 à 16 et 52 à 55 ; colonne 8, lignes 15 à 23). L'étape /c/ des revendication 1 est antériorisée par la figure 8 du document D1, selon laquelle une seconde (et éventuellement une troisième) prononciation du nouveau nom est demandée et soumis à un test de reconnaissance (figure 8 : "good recognize", "bad recognize"). Si le test identifie ladite version provisoire, celle-ci est modifiée. Une version finale mise à jour est mémorisée, correspondant à l'étape /b/ des revendications 1, dans le dictionnaire avec une référence (eg numéro de téléphone) (figure 8 ; colonne 9, ligne 52 à colonne 10, ligne 10).
Il s'ensuit donc, que le procédé connu comprend des étapes qui tombent bien sous les définitions /a/, /b/ et /c/ de la revendication 1 de chacune des deux requêtes du requérant. Par conséquent, l'objet dédites revendications n'est pas nouveau par rapport au procédé d'apprentissage selon le document D1.
3. Selon le requérant, un procédé d'apprentissage selon l'invention différait du procédé connu notamment en deux aspects.
Premièrement, selon le document D1 la version provisoire du jeu de paramètres n'était pas mémorisée dans le dictionnaire mais plutôt faisait partie de modèles de rejet, ni n'était-elle mémorisée avec une référence, comme il est défini par la caractéristique /b/.
Deuxièmement, le document D1 mettait à jour ladite version provisoire à partir de deux échantillons de voix indépendamment des autres jeux de paramètres mémorisés dans le dictionnaire. Il n'était donc pas question de faire un test de reconnaissance parmi l'intégralité des jeux du dictionnaire pour ajuster les paramètres du jeu provisoire en fonction du résultat de ce test de reconnaissance, tel que défini par la caractéristique /c/. Dans ce contexte, l'utilisation de la même désignation "test de reconnaissance" dans les définitions de l'étape /c/ ainsi que dans la phrase "chaque test de reconnaissance " des préambules des revendications 1 en litige ne laissait aucun doute que les tests de reconnaissance étaient les mêmes tout au long des revendications 1. La mise à jour d'une version provisoire d'un jeu de paramètres pour un nouveau nom ou mot à apprendre à l'aide du test de reconnaissance selon l'invention, qui prenait en compte judicieusement la structure préexistante du dictionnaire dont la version provisoire faisait partie, permettait de s'affranchir de l'arbitraire du choix d'un critère de distance entre deux versions successives du jeu de paramètres et donc de mieux répondre aux contraintes d'efficacité et d'ergonomie qui s'appliquent au système d'apprentissage.
4. La Chambre ne partage par l'avis du requérant pour les raisons suivantes :
4.1 En ce qui concerne la caractéristique /b/, le procédé d'apprentissage connu du document D1 utilise un dictionnaire comprenant une liste de noms, c'est-à-dire des références avec des jeux de paramètres (modèles) respectivement associés, ainsi que des modèles de rejet. Si un nouveau nom à apprendre n'est pas reconnu comme un mot déjà existant dans le dictionnaire, ce nom (plus précisément le jeu de paramètres associé) est considéré comme faisant partie des modèles de rejet et est mémorisé (colonne 7, lignes 7 à 18 ; colonne 8, lignes 18 à 23). Une telle mémorisation qui permet un accès ultérieur (colonne 9, lignes 52 et suivantes) requiert une adresse d'écriture.
De manière similaire, selon la description de la présente demande, le dictionnaire de références contient des modèles de mots associés à des références ainsi qu'un ou plusieurs modèles de rejet (colonne 5, linges 41 à 46 ; colonne 6, lignes 14 à 17 de la demande telle que publiée). De plus, il est noté que la référence associée à la version provisoire mémorisée d'un nouveau mot à apprendre n'est pas nécessairement une référence définitive (tel qu'un numéro de téléphone) mais peut être simplement constituée par l'adresse d'écriture dans la mémoire (ibid. colonne 6, lignes 31 à 33).
Il s'ensuit donc que le procédé connu comprend une étape de mémorisation d'une version provisoire d'un nouveau jeu de paramètres qui tombe bien sous le libellé de la caractéristique /b/.
4.2 Quant à la caractéristique /c/, la Chambre est convaincue qu'un lecteur des définitions des revendications 1 en litige comprend bien que la phrase "chaque test de reconnaissance comprenant " indiquée dans les préambules desdites revendications décrit le fait banal, qu'afin de reconnaître un mot parlé, un système de reconnaissance de parole doit faire une comparaison avec tous les mots mémorisés dans le dictionnaire et donc exécuter un test de reconnaissance sur la base de l'ensemble des entrées du dictionnaire. Cependant, une telle nécessité n'existe pas pour le cas d'un procédé d'apprentissage où on veut mettre à jour une version moyenne des jeux de paramètres de plusieurs prononciations d'un nouveau mot. Dans ce cas il suffit qu'un test de reconnaissance dont une prononciation supplémentaire d'un nouveau mot est soumise identifie la version provisoire mémorisée, comme il est défini par la caractéristique /c/ et connue du document D1. Pour ledit lecteur, il est donc concluant que l'étape /c/, se référant à "un test de reconnaissance", n'est pas limitée aux tests de reconnaissance mentionnés dans les préambules des revendications 1.
Une interprétation spécifique de la caractéristique /c/ telle que souhaitée par le requérant n'est pas supportée par le libellé des revendications 1 en litige ni n'est-elle supportée par la description de la demande.
La Chambre ne conteste pas que certains passages de la description de la présente demande se réfèrent à des étapes d'un procédé d'apprentissage qui comprennent un test de reconnaissance pour lequel on effectue apparemment une identification d'une prononciation supplémentaire sur la base des comparaisons avec tous les jeux de paramètres stockés dans le dictionnaire (colonne 6, ligne 42 à colonne 7, ligne 1, en combinaison avec colonne 7, ligne 53 à colonne 8, ligne 17 de la description telle que publiée). Mais, d'une part, la caractéristique /c/ n'est pas spécifique à cet égard, et d'autre part, la description fait également référence aux tests de reconnaissance en phase d'apprentissage dont le but est seulement de discriminer les prononciations nettes et celles affectées de bruits parasites (ibid. colonne 3, lignes 24 à 26 ; colonne 5, ligne 58 à colonne 6, ligne 6). Ces tests qui sont "semblables" à ceux effectués en phase de reconnaissance (ibid. colonne 6, lignes 7 à 10) ne nécessitent cependant que de prendre en considération des modèles de rejet (voir aussi D1 : colonne 9, ligne 54 à colonne 10, ligne 1) et ne tombent donc pas sous la définition des préambules des revendication 1 en litige.
5. En conclusion, aucune des revendications 1 de la requête principale et de la requête subsidiaire présentes ne remplit les critères de l'article 52(1) en combinaison avec l'article 54(1) et (2) CBE.
Par conséquent, il ne peut être fait droit aux requêtes du requérant.
DISPOSITIF
Par ces motifs, il est statué comme suit :
Le recours est rejeté.