19.03.2012, 22:46 | #1 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
Мои первые шаги по созданию искусственного интеллекта
Мои первые шаги по созданию искусственного интеллекта. Все началось с того, что я решил создать робота помощника. У меня не было желания собирать просто игрушку, которая каталась бы по квартире и ничего полезного не выполняла. Я твердо для себя решил что робот должен приносить пользу, иначе это не робот, а просто бесполезная железка. Не буду описывать подробности и детали всего этого процесса, остановлюсь лишь на том что я дошел до создания командного процессора, это такая программа которая должна распознавать голосовые команды и выполнять их. Вот тут я и столкнулся с трудностями распознавания. Прочитал кучу литературы по нейронным сетям. Написал кучу тестовых программ для общего понимания и развития, даже написал программу которая распознает отдельные фразы и графические образы, программа прекрасно распознает отдельные фразы, но научить ее что бы она распознавала предложения у меня так и не получилось. Вернее предложение распознать можно целиком, но выделять из него слова я не смог. Сказывается недостаток знаний в этом направлении. В итоге было решено использовать распознавание речи от Google. Программу переписывал несколько раз менял ее алгоритм и наконец, мне удалось нарисовать алгоритм речевого обучения и общения. Программа теперь может обучатся как человек в младенческом возрасте и для ее обучения не нужно использовать клавиатуру с мышкой, все обучение происходит через речевое общение. Так как алгоритм основан на нейронных сетях то скорость и реакция не зависят об размера базы диалогов. В основном большая часть времени у программы уходит не на распознавание, а на запись звукового файл и на его отправку в облачный сервис Google, только потом после получения от Google текста, программа сопоставляет предложения и находит на не него лучший ответ. Работа над программой продолжается. Прошу помощи всех у кого есть опыт работы в этом направлении. Плоды моего творчества можно увидеть на видео. |
27.05.2012, 09:38 | #2 |
Junior Member
Регистрация: 27.05.2012
Возраст: 51
Сообщений: 7
Вес репутации: 0 |
Я думаю вы знаете эту ссылку, но на всякий случай (http://ab-log.ru/smart-house/speech/speech-recognition). Там так-же есть некоторая информация по поводу нейронных сетей. От гугла отказываться пока нет смысла их сервера действительно качественно распознают наш "великий и могучий". Сколько мне попадалось офлайн вариантов, все как-то коряво работают.
|
27.05.2012, 10:52 | #3 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
Google использует распознавалку от компании Nuance.
Есть программа Dragon от Nuance, проблема только в том, что ее нужно обучать и еще к тому же разными голосами. На это может уйти очень много времени. В процессе изучения ИИ, пришел в выводу что без визуально ассоциативной части ИИ не создать. ИИ при общении, должен рисовать образ у себя в мозгах, каждое слово должно ассоциироваться с графическим образом. Также у человека с образами ассоциируются запахи, вкусы, тактильное ощупывание пальцами рук и т.д.. Только тогда ИИ сможет думать и отвечать осмысленно на вопросы. Примерно так: Мы обучаем ИИ графическим примитивам-окружность. И соответственно ассоциируем примитив с разными фразами : круг, окружность, обруч, кольцо и пр. В итоге после обучения ИИ начнет понимать значение слов круг, обруч, кольцо и рисовать окружность и наоборот при виде окружности ИИ сможет ответить словами круг, обруч, кольцо или окружность |
20.06.2012, 13:48 | #4 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
На данный момент занимаюсь созданием многослойной, масштабируемой нейронной сети, способной распознавать ч/б визуальные образы. На вход нейросети будут подаваться изображения 176х132 пикселей с 16 полутонами, предварительно обработанные.
Как закончу о результатах отпишусь |
29.09.2012, 00:46 | #5 |
Junior Member
Регистрация: 29.09.2012
Сообщений: 1
Вес репутации: 0 |
Будет очень интересно посмотреть на результат. Ждем с нетерпением.
|
29.09.2012, 01:27 | #6 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
Проект пока отложил. Как появится время возобновлю
|
18.10.2012, 05:14 | #7 |
Senior Member
Регистрация: 02.04.2012
Адрес: Питер
Сообщений: 1,125
Вес репутации: 1311 |
Доиграешся ты до истории с Терминатором!!! А вапще круто!!!!!!!
|
18.10.2012, 11:33 | #8 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
Хочу перенести проект на роутер с прошивкой OpenWrt
Распознавалку сделал, но не знаю как изменить default настройки в Alsa драйвере. А именно Sample rate, у меня от 44100 и роутер очень долго его конвертирует в формат Flac. Если сделать ресемплинг то роутер начинает тормозить Может быть есть идеи? |
03.02.2013, 21:19 | #9 |
Senior Member
Регистрация: 06.11.2012
Сообщений: 153
Вес репутации: 0 |
ну тут тоже как с распознаванием видео - нужен ББ..
а откуда вы звук с роутера берете ? с вебкамеры ? |
03.02.2013, 21:28 | #10 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9823 |
Да, с веб камеры. Можно и с USB звуковой карты брать
|
Здесь присутствуют: 11 (пользователей: 0 , гостей: 11) | |
|
|