基于快速傅里叶变换实现的狗声识别器(人工智能)

开发背景

市场上很多宠物狗狗翻译器,猫语翻译器,动物交流器,它们没有采用正确的技术去实现,从而让动物声音翻译器变成人们笑料的工具。本人为了改变现状,刚好被裁员在家里休息,所以努力开发一款真正意义上能识别出动物声音的翻译器。总计耗时1个月(算法折腾半个月,js折腾半个月),躺了几次中医推拿才初步开发完成。整体只完成梦想的一小步,后续只能交给追梦者继续完善。
项目地址:github.com/windawake/dogsound

功能介绍

  1. 可以识别出包括狗狗在内的所有动物发出的声音,前提是先录音存到声音档案里面。
  2. 为了方便使用,开发特有功能:音频裁剪,持续声音采样

预览网址

使用手机火狐浏览器访问 app.jiajuren.net/ 同意开启录音和麦克风权限。

运行项目

运行环境:nginx+ssl+php+mysql

创建bowwow数据库 CREATE DATABASE bowwow; 然后执行根目录bowwow.sql文件,接着把app copy.json修改为app.json并且配置mysql连接参数

在根目录运行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
参考配置

server {
    listen 3000 ssl http2;
    ssl_certificate /web/linux/vscode/ssl/server.crt;
    ssl_certificate_key /web/linux/vscode/ssl/server.key;
    add_header Access-Control-Allow-Origin *;
    server_name 0.0.0.0;
    index index.php index.html index.htm index.nginx-debian.html;
    location / {
        proxy_pass http://127.0.0.1:13000;
    }
}

最后访问127.0.0.1:3000 即可看到本地效果

实现原理

运用了移位运算,门阀检测声音,短时能量,短时过零率,短时快速傅里叶变换等技术,请参考这本书《语音信号处理实用教程》

注意事项

必须要https才能开启录音和麦克风权限

需要安静室内环境,录音要自然,识别时的发音要跟录音时的节奏一致。这样子才能达到80%识别率。室外在噪音干扰下,识别率几乎为0。

本作品采用《CC 协议》,转载必须注明作者和本文链接
windawake
讨论数量: 3

有没有想过深度学习呢?(我也不知道啊,只是听说过。)

1周前 评论
windawake (楼主) 1周前
小瑾她爸 (作者) 1周前

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!