Мои первые шаги по созданию искусственного интеллекта - Форум обсуждения систем "Умный дом", проектов Ардуино, OpenWRT и других DIY устройств

Admin · 19.03.2012, 22:46

Нажмите на изображение для увеличения
Название: neyron.jpg
Просмотров: 490
Размер: 67.8 Кб
ID: 298

Мои первые шаги по созданию искусственного интеллекта.

Все началось с того, что я решил создать робота помощника. У меня не было желания собирать просто игрушку,
которая каталась бы по квартире и ничего полезного не выполняла. Я твердо для себя решил что робот должен приносить пользу, иначе это не робот,
а просто бесполезная железка.

Нажмите на изображение для увеличения
Название: robot.jpg
Просмотров: 639
Размер: 102.3 Кб
ID: 299

Не буду описывать подробности и детали всего этого процесса, остановлюсь лишь на том что я дошел до создания командного процессора,
это такая программа которая должна распознавать голосовые команды и выполнять их. Вот тут я и столкнулся с трудностями распознавания.
Прочитал кучу литературы по нейронным сетям.

Название: neuro.jpg
Просмотров: 4532

Размер: 16.7 Кб

Название: neuro.jpg
Просмотров: 4532

Размер: 16.7 Кб

Написал кучу тестовых программ для общего понимания и развития, даже написал программу которая распознает отдельные фразы и
графические образы, программа прекрасно распознает отдельные фразы, но научить ее что бы она распознавала предложения у меня
так и не получилось. Вернее предложение распознать можно целиком, но выделять из него слова я не смог. Сказывается недостаток знаний в этом направлении. В итоге было решено использовать
распознавание речи от Google. Программу переписывал несколько раз менял ее алгоритм и наконец, мне удалось нарисовать алгоритм
речевого обучения и общения. Программа теперь может обучатся как человек в младенческом возрасте и для ее обучения не нужно
использовать клавиатуру с мышкой, все обучение происходит через речевое общение. Так как алгоритм основан на нейронных сетях
то скорость и реакция не зависят об размера базы диалогов. В основном большая часть времени у программы уходит не на распознавание,
а на запись звукового файл и на его отправку в облачный сервис Google, только потом после получения от Google текста, программа
сопоставляет предложения и находит на не него лучший ответ.

Работа над программой продолжается.
Прошу помощи всех у кого есть опыт работы в этом направлении.

Плоды моего творчества можно увидеть на видео.

Kinstintin · 27.05.2012, 09:38

Я думаю вы знаете эту ссылку, но на всякий случай (http://ab-log.ru/smart-house/speech/speech-recognition). Там так-же есть некоторая информация по поводу нейронных сетей. От гугла отказываться пока нет смысла их сервера действительно качественно распознают наш "великий и могучий". Сколько мне попадалось офлайн вариантов, все как-то коряво работают.

Admin · 27.05.2012, 10:52

Google использует распознавалку от компании Nuance.
Есть программа Dragon от Nuance, проблема только в том, что ее нужно обучать и еще к тому же разными голосами.
На это может уйти очень много времени.

В процессе изучения ИИ, пришел в выводу что без визуально ассоциативной части ИИ не создать.
ИИ при общении, должен рисовать образ у себя в мозгах, каждое слово должно ассоциироваться с графическим образом.
Также у человека с образами ассоциируются запахи, вкусы, тактильное ощупывание пальцами рук и т.д..
Только тогда ИИ сможет думать и отвечать осмысленно на вопросы.
Примерно так:
Мы обучаем ИИ графическим примитивам-окружность.
И соответственно ассоциируем примитив с разными фразами : круг, окружность, обруч, кольцо и пр.
В итоге после обучения ИИ начнет понимать значение слов круг, обруч, кольцо и рисовать окружность и
наоборот при виде окружности ИИ сможет ответить словами круг, обруч, кольцо или окружность

Admin · 20.06.2012, 13:48

На данный момент занимаюсь созданием многослойной, масштабируемой нейронной сети, способной распознавать ч/б визуальные образы. На вход нейросети будут подаваться изображения 176х132 пикселей с 16 полутонами, предварительно обработанные.
Как закончу о результатах отпишусь

Cybersoph · 29.09.2012, 00:46

Цитата:

Сообщение от Admin

На данный момент занимаюсь созданием многослойной, масштабируемой нейронной сети, способной распознавать ч/б визуальные образы. На вход нейросети будут подаваться изображения 176х132 пикселей с 16 полутонами, предварительно обработанные.
Как закончу о результатах отпишусь

Будет очень интересно посмотреть на результат. Ждем с нетерпением.

Admin · 29.09.2012, 01:27

Проект пока отложил. Как появится время возобновлю

stD · 18.10.2012, 05:14

Доиграешся ты до истории с Терминатором!!!

А вапще круто!!!!!!!

Admin · 18.10.2012, 11:33

Хочу перенести проект на роутер с прошивкой OpenWrt
Распознавалку сделал, но не знаю как изменить default настройки в Alsa драйвере.
А именно Sample rate, у меня от 44100 и роутер очень долго его конвертирует в формат Flac. Если сделать ресемплинг то роутер начинает тормозить
Может быть есть идеи?

d00m · 03.02.2013, 21:19

ну тут тоже как с распознаванием видео - нужен ББ..
а откуда вы звук с роутера берете ? с вебкамеры ?

Admin · 03.02.2013, 21:28

Да, с веб камеры. Можно и с USB звуковой карты брать

19.03.2012, 22:46	#1
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	Мои первые шаги по созданию искусственного интеллекта Мои первые шаги по созданию искусственного интеллекта. Все началось с того, что я решил создать робота помощника. У меня не было желания собирать просто игрушку, которая каталась бы по квартире и ничего полезного не выполняла. Я твердо для себя решил что робот должен приносить пользу, иначе это не робот, а просто бесполезная железка. Не буду описывать подробности и детали всего этого процесса, остановлюсь лишь на том что я дошел до создания командного процессора, это такая программа которая должна распознавать голосовые команды и выполнять их. Вот тут я и столкнулся с трудностями распознавания. Прочитал кучу литературы по нейронным сетям. Написал кучу тестовых программ для общего понимания и развития, даже написал программу которая распознает отдельные фразы и графические образы, программа прекрасно распознает отдельные фразы, но научить ее что бы она распознавала предложения у меня так и не получилось. Вернее предложение распознать можно целиком, но выделять из него слова я не смог. Сказывается недостаток знаний в этом направлении. В итоге было решено использовать распознавание речи от Google. Программу переписывал несколько раз менял ее алгоритм и наконец, мне удалось нарисовать алгоритм речевого обучения и общения. Программа теперь может обучатся как человек в младенческом возрасте и для ее обучения не нужно использовать клавиатуру с мышкой, все обучение происходит через речевое общение. Так как алгоритм основан на нейронных сетях то скорость и реакция не зависят об размера базы диалогов. В основном большая часть времени у программы уходит не на распознавание, а на запись звукового файл и на его отправку в облачный сервис Google, только потом после получения от Google текста, программа сопоставляет предложения и находит на не него лучший ответ. Работа над программой продолжается. Прошу помощи всех у кого есть опыт работы в этом направлении. Плоды моего творчества можно увидеть на видео.

03.02.2013, 21:28	#10
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	Да, с веб камеры. Можно и с USB звуковой карты брать __________________ Интернет магазин электронных компонентов.

27.05.2012, 09:38	#2
Kinstintin Junior Member Регистрация: 27.05.2012 Возраст: 51 Сообщений: 7 Вес репутации: 0	Я думаю вы знаете эту ссылку, но на всякий случай (http://ab-log.ru/smart-house/speech/speech-recognition). Там так-же есть некоторая информация по поводу нейронных сетей. От гугла отказываться пока нет смысла их сервера действительно качественно распознают наш "великий и могучий". Сколько мне попадалось офлайн вариантов, все как-то коряво работают.

27.05.2012, 10:52	#3
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	Google использует распознавалку от компании Nuance. Есть программа Dragon от Nuance, проблема только в том, что ее нужно обучать и еще к тому же разными голосами. На это может уйти очень много времени. В процессе изучения ИИ, пришел в выводу что без визуально ассоциативной части ИИ не создать. ИИ при общении, должен рисовать образ у себя в мозгах, каждое слово должно ассоциироваться с графическим образом. Также у человека с образами ассоциируются запахи, вкусы, тактильное ощупывание пальцами рук и т.д.. Только тогда ИИ сможет думать и отвечать осмысленно на вопросы. Примерно так: Мы обучаем ИИ графическим примитивам-окружность. И соответственно ассоциируем примитив с разными фразами : круг, окружность, обруч, кольцо и пр. В итоге после обучения ИИ начнет понимать значение слов круг, обруч, кольцо и рисовать окружность и наоборот при виде окружности ИИ сможет ответить словами круг, обруч, кольцо или окружность

20.06.2012, 13:48	#4
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	На данный момент занимаюсь созданием многослойной, масштабируемой нейронной сети, способной распознавать ч/б визуальные образы. На вход нейросети будут подаваться изображения 176х132 пикселей с 16 полутонами, предварительно обработанные. Как закончу о результатах отпишусь

29.09.2012, 01:27	#6
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	Проект пока отложил. Как появится время возобновлю

18.10.2012, 05:14	#7
stD Senior Member Регистрация: 02.04.2012 Адрес: Питер Сообщений: 1,125 Вес репутации: 1311	Доиграешся ты до истории с Терминатором!!! А вапще круто!!!!!!!

18.10.2012, 11:33	#8
Admin Administrator Регистрация: 12.04.2010 Адрес: Москва Сообщений: 9,618 Вес репутации: 9823	Хочу перенести проект на роутер с прошивкой OpenWrt Распознавалку сделал, но не знаю как изменить default настройки в Alsa драйвере. А именно Sample rate, у меня от 44100 и роутер очень долго его конвертирует в формат Flac. Если сделать ресемплинг то роутер начинает тормозить Может быть есть идеи?

03.02.2013, 21:19	#9
d00m Senior Member Регистрация: 06.11.2012 Сообщений: 153 Вес репутации: 0	ну тут тоже как с распознаванием видео - нужен ББ.. а откуда вы звук с роутера берете ? с вебкамеры ?

Здесь присутствуют: 11 (пользователей: 0 , гостей: 11)