Это концепция, которая у меня есть для более быстрой и простой голосовой модели. Он использует tensorflow и java, и я надеюсь реализовать это в ара , приложение, над которым я работаю.
В моей базовой версии распознавания голоса ara есть этот код:
switch (labelIndex - 2) { case 0: resulttxt = "yes"; break; case 1: resulttxt = "no"; break; case 2: resulttxt = "up"; break; case 3: resulttxt = "down"; break; case 4: resulttxt = "left"; break; case 5: resulttxt = "right"; break; case 6: resulttxt = "on"; break; case 7: resulttxt = "off"; break; case 8: resulttxt = "stop"; break; case 9: resulttxt = "go"; break; }
Моя идея использует эту базовую концепцию, но вместо полных слов ищет звуки, а затем слова. это может быть новый код распознавания:
switch (labelIndex - 2) { case 0: resulttxt = resulttxt + "LongA"; break; case 1: resulttxt = resulttxt + "ShortA"; break; case 2: resulttxt = resulttxt +"ShortB"; break; case 3: resulttxt = resulttxt +"LongB"; // Such as the words be and bee. break; case 4: resulttxt = resulttxt +"ShortC"; break; // ....................................................... }
Пожалуйста, внесите свой вклад, я не эксперт в области искусственного интеллекта, так что, если это глупо, скажите мне.
Оригинал: “https://dev.to/fultonbrowne/suggestions-for-an-ai-concept-1f6h”