Method for training an automatic speech recognition system

Procédé permettant de former un système automatique de reconnaissance vocale

Abstract

La présente invention concerne un système et un procédé de reconnaissance vocale. Les modes de réalisation dudit système peuvent comprendre la réception, dans un premier dispositif informatique, d'un signal distant émanant d'un dispositif informatique distant, le signal distant étant émis par le biais d'une première voie et correspondant à un son audible. Les modes de réalisation peuvent comprendre en outre la réception, dans le premier dispositif informatique, d'un signal de proximité émanant d'un dispositif informatique de proximité, le signal de proximité étant émis par le biais d'une seconde voie et correspondant au son audible. Le signal distant et le signal de proximité sont reçus pendant la phase d'inscription d'un système distant de reconnaissance vocale. Les modes de réalisation peuvent également comprendre la mise à jour, dans le premier dispositif informatique, d'un ou plusieurs modèles associés à un système de reconnaissance vocale distant sur la base, au moins en partie, d'une ou plusieurs caractéristiques du signal distant et d'une ou plusieurs caractéristiques du signal de proximité.
A system and method for speech recognition is provided. Embodiments may include receiving, at a first computing device, a far-talk signal from a far-talk computing device, the far-talk signal transmitted using a first channel and corresponding to an audible sound. Embodiments may further include receiving, at the first computing device, a near-talk signal from a near-talk computing device, the near-talk signal transmitted using a second channel and corresponding to the audible sound, wherein the far-talk signal and the near-talk signal are received during an enrollment phase of a far-talk speech recognition system. Embodiments may also include updating, at the first computing device, one or more models associated with a far-talk speech recognition system based upon, at least in part, one or more characteristics of the far-talk signal and one or more characteristics of the near-talk signal.

Claims

Description

Topics

Download Full PDF Version (Non-Commercial Use)

Patent Citations (6)

    Publication numberPublication dateAssigneeTitle
    US-2003235244-A1December 25, 2003Pessoa Lucio F. C., Dyba Roman A., He Perry P.Method and apparatus for performing adaptive filtering
    US-2011194685-A1August 11, 2011Nxp B.V.Method and system for nonlinear acoustic echo cancellation in hands-free telecommunication devices
    US-2012150536-A1June 14, 2012International Business Machines CorporationModel restructuring for client and server based automatic speech recognition
    US-2012243698-A1September 27, 2012Mh Acoustics,LlcDynamic Beamformer Processing for Acoustic Echo Cancellation in Systems with High Acoustic Coupling
    US-6434110-B1August 13, 2002Cirrus Logic, Inc.Full-duplex speakerphone circuit including a double-talk detector
    US-6707910-B1March 16, 2004Nokia Mobile Phones Ltd.Detection of the speech activity of a source

NO-Patent Citations (2)

    Title
    ECMA INTERNATIONAL.: 'Designing an Object Model for ECMA-269 (CSTA).' TECHNICAL REPORT ECMA TR /88, [Online] June 2004, Retrieved from the Internet: [retrieved on 2013-04-12]
    ERDOGAN ET AL.: 'Multi-modal Person Recognition for Vehicular Applications.' MULTIPLE CLASSIFIER SYSTEMS (MCS 2005), LECTURE NOTES IN COMPUTER SCIENCE (LNCS, [Online] vol. 3541, December 2005, pages 366 - 375 Retrieved from the Internet: [retrieved on 2013-04-12]

Cited By (0)

    Publication numberPublication dateAssigneeTitle