深圳市奥斯恩净化技术有限公司

主营产品: 环境噪声扬尘监测系统,手持式粉尘检测报警仪,在建工地扬尘在线监控系统,建设工地扬尘噪声污染在线监测系统

10

联系电话

18948352970

您现在的位置: 首页> 技术文章 > 奥斯恩声源识别模型盒子产品 支持 HTTP 协议 识别准确率高

空气质量微型监测站

网格化空气监测站

VOCS在线监测系统

VOC在线监测系统

无组织排放在线监测系统

工地扬尘噪声在线监测系统

工地扬尘噪声联动控制在线监测系统

工地塔吊雾炮喷淋降尘在线监测系统

扬尘噪声视频在线监测系统

混凝土搅拌站扬尘监控系统

恶臭实时监测系统

粉尘浓度报警仪

氮氧化物监测系统

车载环境监测系统

车载式扬尘噪声视频监测系统

走航环境监测车

景区公园负氧离子监测站

路况能见度监测系统

云平台

油烟在线监测

物联网自动气象站

防爆报警粉尘检测仪

室内环境质量监测仪

扬尘传感器

室内外噪声环境监测系统

手持式粉尘浓度检测仪

固定式粉尘浓度检测报警仪

无人机环境监测系统

森林防火监测系统

气体检测仪

碳排放气体监测

水质监测系统

烟气在线监测系统

机动车尾气监测

手持式扬尘噪声检测仪

便携式环境在线监测仪

噪声在线监测系统

环保大数据监测平台

水质综合检测仪

尘埃粒子计数器

远程喊话在线监控系统

解决方案

监测平台

环境监测系统

气体报警器

扬尘在线监测设备

负氧离子监测系统

氨逃逸在线监测系统

智慧工地视频监控

工况电力监测系统

气象监测站

辐射监测系统

光伏组件灰尘监测

大坝安全预警系统

气溶胶检测仪

冷链温湿度监测

消防水池液位水位监测

甲烷监测系统

环境监测传感器

公司信息

人:
梁经理
话:
机:
18948352970
真:
86-0755-85296639-604
址:
深圳市宝安区凤塘大道141号大洋田工业区2栋4楼
编:
518100
化:
www.china-osen.cn
址:
www.china-aosien.com
铺:
http://www.lamourmm.com/st334553/
给他留言

奥斯恩声源识别模型盒子产品 支持 HTTP 协议 识别准确率高

2024-12-27  阅读(851)

声源识别模型盒子产品背景

声纹识别,也被称为说话人识别,是一种生物识别技术,通过转换声音信号为电信号,用计算机进行特征提取和身份验证。其生物学基础在于生物的语音信号携带着声波频谱,就像指纹一样具有稳定性。

人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。

换做其他生物或者物体也是。同一类的声音的语音信号也携带着声波频谱。提取出来并做分类和识别。这个就是声纹识别技术。

声纹识别的主要任务包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。

image.png

声源识别模型盒子技术特点

1.噪声声音类型识别是指通过机器学习算法,对环境中的噪声进行分类,以判断其可能的来源和类型。例如,区分机器噪声、人声噪声、交通噪声等。

2. AI在噪声声音类型识别中的应用主要体现在深度学习技术中,特别是卷积神经网络的应用。首先,需要收集大量的声音数据,并利用深度学习算法对这些数据进行训练,以提取出有用的特征并进行模型优化。然后,将输入的声音与已知的声音模型进行比对,通过计算输入声音的特征与模型之间的距离或相似度,来确定输入声音的身份。

3.此外,对于特定的应用场景,如室内场景、户外场景识别,公共场所、办公室场景识别等,还可以使用专门的音频处理前端部分。

4.值得注意的是,尽管AI在噪声声音类型识别方面有着广泛的应用前景,但是在实际应用中仍然面临着许多挑战,如噪声环境的复杂性、语音信号的多样性以及模型的优化等问题。因此,如何提高噪声声音类型识别的准确性和鲁棒性,仍然是未来研究的重要方向。

声纹14.jpg


声源识别模型盒子技术路线

1.建立音频样例库,覆盖面广,根据不同的噪声监管单位将声音划分为五大类,不少于50个声音子类别;

2.通过深度学习AI技术,对噪声样本进行分析和处理,提取出其中的声纹特征,构建声纹识别模型;

3.不断的测试和优化,提高声纹识别模型的准确性和鲁棒性,使其能够在各种环境和条件下都能准确地识别出声纹类型;

4. 采用深度卷积神经网络算法实现音频事件的识别分类。通过卷积操作对音频进行时域特征和logmel频域特征的提取,并结合波形的时域特征和频域特征作为音频的有效特征,再通过卷积采样进一步获取特征图,最终以全连接网络分类器实现特征的类别分类。

声纹16.jpg


技术特点

主控芯片:Rockchip RK358

CPU:8 核 64 位处理器

4 个 Cortex-A76 和 4 个 Cortex-A55 及独立的 NEON 协处理器

Cortex-A76 主频 2.4GHz,Cortex-A55 主频 1.8GHz

GPU:集成 ARM Mali-G610;内置 3D GPU;兼容 OpenGL ES1.1/2.0/3.2、

OpenCL 2.2 和 Vulkan 1.2

NPU:内嵌的 NPU 支持 INT4/INT8/INT16/FP16 混合运算,算力高达6Top

存储:8G+64G emmc

接口:有 2 个 HDMl 输出端口,1 个输入 HDMl 端口,最高可解码 8K@60P视频,两个 PCIe 扩展的 2.5G 以太网接口,配备一个支持安装 NVMe 固态硬盘的 M.2 M-Key 插槽,一个支持 Wi-Fi6/BT 模块的 M.2 E-Key 插槽。此外,有 2 个 USB 3.0、2 个 USB 2.0、2 个 Type-C(其中一个为电源接口)

基于 Pytorch 实现的声纹识别模型:模型是一种基于深度学习的说话人识别系统,其结构中融入了通道注意力机制、信息传播和聚合操作。这个模型的关键组成部分包括多层帧级别的 TDNN 层、一个统计池化层以及两层句子级别的全连接层,此外还配备了一层 softmax,损失函数为交叉熵。

特征提取:预加重->分加窗->离散傅里叶变换->梅尔滤波器组->逆离散傅里叶变换

模型训练集:>100000 个训练样本

声音类型:声音类型主要划分为五大类别,分别为生活噪声、施工噪声、工业噪声、交通噪声、自然噪声,其中包含打雷,犬吠,刮风,敲击、虫鸣鸟叫、蛙鸣等不少于 50 个声音子类别

声纹识别准确率:≥90%

识别响应速率:<1s

调用方式:支持云端调用或者本地终端调用

技术协议:支持 HTTP 协议

接口种类:USB、HDMI、SD、RJ45

电源接口:TYPE-C

工作电压:5V3A





产品对比 产品对比 二维码 在线交流

扫一扫访问手机商铺

对比框

在线留言