拓普网

会员登录区 电子信箱 密码 注册会员 找回密码 信息修改 会员注销

分类目录  购物车  我的帐户  客户服务  在线留言 即时交谈 地理位置
首页 | 每日快递 | 新书预告 | 精品图书 | 热销图书 | 订单查询 | 缺书登记 | 汇款招领 | 问题订单
搜索 
 
首页 > 目录 >

实用语音识别基础 目录

实用语音识别基础

实用语音识别基础

购买实用语音识别基础
作    者  王炳锡
出 版 社  国防工业出版社
书    号  118-03746-X
丛    书  21世纪高等院校优秀教材
责任编辑 开本 16
出版时间 2005年1月 字数 539千字
装    帧 平装 印张 0
带    盘 页数 363
定    价 ¥38.0    
       
普通会员 ¥31.2  
银牌会员 ¥30.4    
金牌会员 ¥29.6    
批量购书 电话: 010-51287918
 
本图书首页 内容提要 目录 相关图书 相关丛书 相关系列书 作者出版物 作者介绍 前言

实用语音识别基础 目录

第1章绪论
1.1概述
1.2语音识别综述
1.3国内外语音识别的研究现状和发展趋势
参考文献
第一部分基本理论
第2章听觉机理和汉语语音基础
2.1概述
2.2听觉机理和心理
2.2.1语音听觉器官的生理结构
2.2.2语音听觉的心理
2.3发音的生理机构与过程
2.4汉语语音基本特性
2.4.1元音和辅音
2.4.2声母和韵母
2.4.3音调(字调)
2.4.4音节(字)构成
2.4.5汉语的波形特征
2.4.6元音的频谱特性
2.4.7辅音的频谱特性
2.4.8汉语语音的韵律特征
2.5小结
参考文献
第3章语音信号处理方法--时域处理
3.I概述
3;2语音信号的数字化和预处理
3.2.1语音信号的数字化
3.2.2语音信号的预处理
3.3短时平均能量和短时平均幅度
3.3.1短时平均能量
3.3.2短时平均幅度
3.4短时过零分析
3.4.1短时平均过零率
3.4.2短时上升过零间隔
3.5短时自相关函数和平均幅度差函数
3.5.1短时自相关函数
3.5.2短时平均幅度差函数
3.6高阶统计量
3.6.1单个随机变量情况
3.6.2多个随机变量及随机过程情况
3.6.3高斯过程的高阶累积量
3.7小结
参考文献
第4章语音信号处理方法--时频处理
4.1概述
4.2短时傅里叶变换
4.2.1短时傅里叶变换的定义和物理意义
4.2.2基于短时傅里叶变换的语谱图及其时频分辨率
4.2.3短时傅里叶谱的采样
4.3小波变换
4.3.1连续小波变换
4.3.2;进小波变换
4.3.3离散小波变换
4.3.4多分辨分析
4.3.5正交小波包
4.4Wigner分布
4.4.1Wigner分布的定义
4.4.2Wigner分布的一般性质
4.4.3两个信号和的Wigner分布
4.4.4Wigner分布的重建
4.4.5Wigner分布的实现
4.5小结
参考文献
第5章语音信号处理方法--倒谱同态处理
5.1概述
5.2复倒谱和倒谱
5.2.1定义
5.2.2复倒谱的性质
5.3语音信号的倒谱分析与同态解卷积
5.3.1叠加原理和广义叠加原理
5.3.2同态解卷特征系统和同态解卷反特征系统
5.3.3同态解卷系统
5.3.4语音的复倒谱及同态解卷
5.4避免相位卷绕的算法
5.4.1最小相位信号法
5;4.2递归法
5.5小结
参考文献
第二部分语音识别系统
第6章语料库
6.1概述
6.2语料库的基本特征
6.3语料库的类型
6.4语音语料库
6.4.1语音语料库建立、收集和标注的意义
6.4.2语音语料库的建立和收集要点
6.4.3标准语音库语音特性描述
6.5语料库的设计举例--863汉语普通话语音合成语料库的设计
6.5.1语料库设计原则
6.5.2语音库的标注
6.5.3与语音语料库相关的文字语料库标注
6.6小结
参考文献
第7章语音识别的预处理
7.1概述
7.2语音识别单元的选取
7.2.1汉语音节
7.2.2汉语的基本音素
7.2.3汉语半音节
7.3自动分段--端点检测技术
7.3.1基于能量的端点检测
7.3.2基于IPC-10声码器的端点检测
7.3.3基于信息熵的语音端点检测
7.3.4基于频带方差的端点检测
7.3.5基于倒谱特征的带噪语音信号端点检测
7.3.6基于HMM的端点检测方法
7.3.7基于分形技术的端点检测
7.3.8基于自相关相似距离的端点检测
7.3.9基于迟滞编码的端点检测
7.3.10实时端点检测算法
7.4小结
参考文献
第8章语音信号特征参数
8.1概述
8.2基音周期
8.2.1自相关法及其改进
8.2.2并行处理法
8.2.3倒谱法
8.2.4简化逆滤波法
8.3线性预测参数
8.3.1线性预测信号模型
8.3.2线性预测误差滤波
8.3.3语音信号的线性预测分析
8.3.4线性预测分析的解法
8.3.5斜格法及其改进
8.4线谱对(1SP)参数
8.4.1线谱对分析原理.
8.4.2线谱对分析的求解
8.5LPCC参数
8.6MFCC参数
8.7ASCC参数
8.8感觉加权的线性预测(PLP)特征
8.8.1PLP参数
8.8.2RASTA-PLP参数
8.9动态差分参数
8.10高阶信号谱类特征
8.10.1WV谱的定义及其主要性质
8.10.2WV谱计算式的一些变形
8.11小结
参考文献+
第9章特征变换
9.1概述
9.2线性判别分析(LDA)
9.2.1线性判别分析的概念
9.2.2广义线性判别函数
9.2.3Fisher线性判别
9.2.4多类问题
9.3主分量分析(PCA)
9.3.1基于K-l变换的主分量分析
9.3.2随机向量的K-L展开
9.3.3基于K-L变换的降维
9.4独立分量分析(1CA)
9.4.1引言
9.4.2线性独立分量分析
9.4.3线性独立分量分析算法
9.4.4独立分量分析的预处理
9.4.5非线性独立分量分析
9.5小结
参考文献
第10章语音识别的模型
10.1概述
10.2动态时间规整(DTW)
10.2.1动态规划技术(DP)
10.2.2DTW算法的改进
10.3隐马尔可夫模型(HMM)
10.3.1隐马尔可夫模型的定义
10.3.2HMM中的3个基本问题及其解决方案
10.3.3隐马尔可夫模型的类型
10.3.4HMM算法实现的问题
10.4分类模型(SVM)
10.4.1引言
10.4.2学习问题
10.4.3学习过程一致性的条件
10.4.4学习过程收敛速度的界
10.4.5结构风险最小归纳原理
10.4.6支持向量机
10.5人工神经网络
10.5.1引言
10.5.2神经元的基本模型
10.5.3前向网络
10.5.4反馈网络
10.6'高斯混合模型(GMM)
10.6.1高斯混合模型的定义
10.6.2参数调整算法--EM算法
10.7小结
参考文献
第三部分语音识别中关键处理技术
第11章说话人自适应和说话人归一化技术
11.1概述
11.2自适应方式的分类
11.3MLLR算法介绍
11.3.1语音特征空间的划分
11.3.2参数的估计
11.3.3对均值矢量的变换
11.4MAP算法介绍
114.1MAP算法准则
11.4.2MAP算法公式推导
11.4.3MAP算法讨论
11.5说话人归一化技术.
11.5.1说话人归一化技术原理
11.5.2声道长度归一化(VTLN)
11.6小结
参考文献
第12章噪声抑制
12.1概述
12.2基于小波变换的噪声抑制
12.2.1利用小波变换去除周期性噪声
12.2.2利用小波变换去除冲激噪声
12.2.3利用小波变换去除宽带噪声
12.2.4小波去噪方法的分析
12.3基于EVRC编码的噪声抑制
12.4基于HMM模型的噪声补偿
12.5小结
参考文献
第13章信道补偿
13.1概述
13.2稳健语音识别技术
13.2.1稳健语音识别的提出
13.2.2稳健语音识别的研究现状
13.3信道补偿技术的主要方法
13.3.1经验补偿技术
13;3.2盲补偿
13.3.3基于特征及模型的补偿
13.4信道补偿技术在语音识别中的应用
13.4.1信道补偿技术在汽车内语音识别中的应用
13.4.2基于信道补偿的电话语音识别
13.5小结
参考文献
第四部分语音识别应用
第14章说话人识别
14.1概述
14.2说话人识别的基本原理
14.2.1说话人识别系统的典型结构
14.2.2技术原理
14.3说话、人识别的特征选择
14.3.1说话人识别系统中常用的特征
14.3.2特征参数的统计评价
14.4说话人识别的主要方法
14.4.1模板匹配法
14.4.2概率统计方法
14.4.3辨别分类器方法
14.4.4混合方法
14.5判决规则与性能评价标准
14.5.1说话人辨认
14.5.2说话人确认(检测)
14.6说话人识别中的稳健技术
14.7系统举例
14.7.1GMM说话人辨认算法
14.7.2SVM-CMM混合模型
14.7.3GMM-UBM说话人确认
14.8小结
参考文献
第15章关键词识别
15.1概述
15.2关键词识别及其与连续语音识别的关系
15.3关键词识别原理
15.3.1关键词识别系统组成
15.3.2关键词识别的基本问题
15.3.3关键词识别系统的主要技术难点
15.4搜索策略
15.4.1语音起始和结束点的粗判
15.4.2帧同步的Viterbi解码算法
15.4.3加入驻留惩罚的改进Viterbi解码算法
15.4.4语法节点处的路径合并
15.4.5回溯
15.5识别结果的确认
15.5.1置信度的原理
15.5.2利用反词模型的拒识方法
15.5.3利用识别结果本身信息的拒识方法
15.6系统实现
15.6.1训练和识别系统框图
15.6.2训练系统的具体实现
15.6.3识别系统的具体实现
15.7小结
参考文献
第16章语言辨识
16.1概述
16.1.1语言辨识的原理
16.1.2语言辨识技术研究发展的历史
16.2语言辨识所需要的有用信息
16.3针对自动语言辨识的知觉研究
16.4语言辨识的主要方法
16.4.1频谱相似性方法
16.4.2基于韵律信息的方法
16.4.3基于音素识别的方法
16.4.4基于罗语言语音单元的方法
16.4.5单词层次方法
16.4.6基于连续语音识别的方法
16.4.7元音系统模型
16.5语言辨识系统举例
16.5.1基于GMM-UBM模型的语言辨识系统
16.5.2基于最小分类误差准则的语言辨识系统
16.5.3基于说话人聚类和高斯混合模型的语言辨识系统
16.5.4基于时频主分量分析和高斯混合模型的语言辨识系统
16.5.5基于高斯混合二元模型的语言辨识系统
16.6语言辨识系统评估
16.7小结
参考文献
第17章连续语音识别
17.1概述
17.2连续语音识别整体模型
17.3声学模型
17.3.1语音识别单元的选取
17.3.2基于子词单元HMM的训练
17.4连续语音识别中的搜索策略
17.4.1传统的帧同步算法
17.4.2基于统计知识的帧同步搜索算法原理
17.4.3受词法约束的词搜索树
17.4.4连续语音识别中的双层搜索网络
17.5语言模型
17.5.1基于规则的方法
17.5.2基于统计的方法
17.5.3N-gram模型的平滑
17.5.4基于文法规则的方法和基于统计的方法相结合
17.6小结
参考文献
附录英汉名词对照

 
   新手指南    联系我们    付款方式     配送方法     会员制度    售后服务    拓普简介

Copyright © 2008 toopoo.com Inc. All Rights Reserved. 拓普公司 版权所有
地址: 北京市海淀区中关村大街11号中关村E世界A座1132A  邮政编码: 100080