主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
盲人智能手机
小类:
信息技术
简介:
盲人智能手机是一款非视觉、全音控、带有盲文识别功能的手机。该手机仅一键操作,利用25条语音控制指令实现通话、短信、通讯录、快捷键等各项功能。盲人智能手机不仅可完全实施语音输入、语音输出、语音控制,还可通过触摸屏进行平面化盲文信息输入,后天因素致盲人群可直接输入汉字、字母与数字。盲人智能手机以语音菜单的形式逐级提示操作,在每条音控指令正确识别后,都有相应的语音提示。例如当收到短信或其它数据信息时,系统自动将短信等信息内容读出。这种非视觉、适合不同文化程度、不同致盲原因的盲人使用的新型智能手机,为其它助盲设备的开发与应用提供了实践经验和成功案例。
详细介绍:
盲人智能手机是一款非视觉、全音控、带有盲文识别功能的手机。整个系统仅一键操作,并且通过25条语音控制指令,实现通话、短信、通讯录、快捷键等各项功能。 该手机具有一套全语音控制系统,所有的功能操作均通过语音控制实现。采用基于隐马尔可夫模型的非特定人语音识别算法,在ADSP-BF533数字信号处理器上实现了包含25条音控指令、6个固定语音拨号、0~9等10个数字的全语音操控界面;利用语音指令分级识别方法,语音实现功能控制,且语音指令具有较高的识别率。 盲文输入使用触摸屏手写方式,采用组合模板匹配法实现了对于六点式Braille盲文字符的识别。盲人使用者通过触摸屏输入平面化后的盲文,系统自动转化为指令和信息。对于后天性盲人,系统同时开发了汉字、字母与数字识别功能。盲文模式与汉字模式利用语音命令相互切换。 盲人智能手机使用便捷。盲人智能手机具备一套辅助语音操控系统,数字录音与播报技术实现了各种语音提示与播报的辅助功能。盲人以语音菜单的形式逐级操作,音控指令正确识别后,会给出相应的语音提示;当收到短信或其它数据信息时,系统会自动将短信等数据信息内容读出,大大增强了盲人智能手机的实用性。系统设置了报时与电量查询功能,以语音形式播报当前时间与电池剩余电量。 综合以上设计,盲人智能手机除具备普通手机的通信功能功能外,更具有Braille盲文识别、手写汉字(及字母、数字等)识别、非特定人语音识别、菜单\短信\通讯\语音提示等功能,这些设计不仅可以应用于手机,更为其它助盲设备的开发与应用提供了实践经验与成功范例。 功能简介: (1)非特定人语音识别与控制。采用25条音控指令作为控制系统,使用较为标准普通话输入特定指令便可实现操作。 (2)盲文识别。使用者通过触摸屏输入平面化的Braille盲文字符,系统将平面化盲文字符自动转换为英文字母。 (3)汉字识别。使用者通过触摸屏输入汉字、字母或数字,系统对输入的字符进行处理,得到汉字内码或字母、数字的ASCII码。 (4)语音提示。每条指令识别后都有特定语音输出提示,使用者可根据提示进行下一步操作。 (5)短信读出。每收到一条短信,系统会根据指令,通过AD1836A的DAC将短信内容输出为语音信号播报出来。 (6)通话功能。音控指令直接拨打和接听电话。 (7)短信功能。音控指令收发短信。 (8)紧急状态语音拨号。语音拨打110、120、119紧急号码。 (9)固定语音拨号。具有“家庭”、“办公室”等六个固定语音拨号。 (10)连续数字语音拨号。连续说出目标号码实现拨号。 (11)报时功能。播报当前时间。 (12)电量查询。查询播报当前电池电量、低电量自动报警。 技术指标: 同级语音指令识别率高于92%;连续数字语音拨号识别率高于75%;盲文字符识别率高于91%;语音指令识别时间小于0.5秒;数字语音拨号识别时间小于3秒;工作频率:发射频率890~915MHz;接收频率935~960MHz;信道编码:循环冗余编码,1/2卷积码及交积编码;载波间隔:200kHz;调制方式:高斯滤波最小频移键控(GMSK),BT=0.3,调制速率为270.833kbit/s。

作品图片

  • 盲人智能手机
  • 盲人智能手机
  • 盲人智能手机

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

设计目的和思路 盲人在残疾人总数所占据的比例超过15%,由于盲人致盲原因不同,且受教育程度不同,如何让盲人方便、简捷地使用手机等电子产品,成为社会公益关心的问题。本款全语音控制、具有盲文识别功能的盲人智能手机能够更好地服务了盲人这一残疾人群体,为其它助盲设备的开发提供了实践经验。 技术关键与创新点 针对电子产品存在无法输入盲文的问题,项目组提出了立体Braille盲文的平面化转换的方法,建立了一种新型盲文智能信息处理方法。使用者可以通过触摸屏输入平面化后的盲文,系统随即自动对其进行识别。 盲人智能手机具有一套全语音控制系统,所有功能操作均以语音控制的形式来实现。该系统以基于隐马尔可夫模型的非特定人语音识别算法为基础,在ADSP-BF533数字信号处理器上实现了包含25条音控指令、6个固定语音拨号、数字0~9的全语音操控界面;并提出语音指令分级识别方法,大大提高了语音指令的识别率。 考虑到盲人使用手机过程中的便捷性,盲人智能手机具备一套辅助语音操控系统。盲人在使用手机时以语音菜单的形式逐级操作;当收到短信或有其它数据信息时,系统会自动将短信等数据信息内容读出。 主要技术指标 (1)盲人智能手机的同级语音指令识别率达到92%; (2)连续数字语音拨号识别率超过75%; (3)盲文字符识别率高达91%; (4)语音指令识别时间小于0.5秒; (5)数字语音拨号识别时间小于3秒。

科学性、先进性

市场上可供盲人使用的电子产品采用特定人语音控制或触摸操作,未区分后天性盲人、先天性盲人和低势力患者的不同使用需求。高精度的盲文信息处理方法与非特定人语音识别算法成为盲人手机等电子产品研发的技术难题。 国内外研究人员研究了将盲文处理由原来的完全手工操作转换为计算机处理的方式及原理,但均为单一的软件或硬件解决方法,仍存在硬件实现复杂或软件开销较大的问题,不利于盲文信息处理方法的大规模推广和应用。 盲人智能手机充分考虑了先天性盲人、后天致盲、弱视等群体的特殊情况,以DSP为信息处理核心,实现语音、盲文和触觉感知等多信号的检测和识别;创造性地提出并实现了Braille立体盲文的平面化输入方法;研究并实现了基于隐马尔可夫模型的非特定人语音识别技术;提出并建立了基于Nuttall加窗插值FFT的语音信号分析方法,提出了盲人智能手机的多信息(语音、盲文和触觉感知等)处理方法;设计了一款非视觉、适合不同文化程度、不同致盲原因的盲人使用的新型智能手机,完成了原理性样机试制。

获奖情况及鉴定结果

“盲人智能手机”获2009第六届长沙市大学生科技创新创业竞赛研究生组总冠军。 鉴定专家意见:盲人智能手机服务残疾人,创新点突出,具有积极的社会意义和甚大的经济效益。

作品所处阶段

实验室阶段

技术转让方式

作品可展示的形式

实物、产品

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

项目组提出了一种新型盲文智能信息处理方法,以及基于指令分级的嵌入式非特定人语音识别方法,设计了一款非视觉的新型盲人智能手机。盲人智能手机具有完全语音指令控制、多级菜单语音提示、盲文与汉字识别等功能,其操作简单,充分考虑了视力残疾患者的需求。盲文智能信息处理方法与多级指令语音识别与控制同样可以广泛应用于其它电子产品,如GPS终端、数码相机、ATM、自动售票机等。 我国视力残疾患者近1300万,其中盲人约550万,低视力人群约750万;而且我国每年会新增盲人约45万,低视力135万。盲文智能信息处理方法和盲人智能手机具有巨大的市场潜力。截至2009年6月,正常人手机等电子产品普及率已达到41.6%,而盲人专用电子产品普及率不足1%。预计盲人智能手机的国内市场年需求量在80万台以上。预计产品前3年销售量为40万台,每台售价1200元(成本价:约450元),前三年销售额约为4.8亿元,净利润约3亿元。盲文智能信息处理方法在其它电子产品中的应用,可创造更大的经济效益和社会效益。

同类课题研究水平概述

美国学者McMillin1989年研究了盲文计算机处理新方法;中国学者李宏乔等2002年提出了一种盲文形式模型和汉语-盲文机器翻译方法。现有盲文处理均为单一的软件或硬件解决方法,存在硬件实现复杂、软件量大等问题,不利于嵌入式系统实现和推广应用。 国内同类产品情况 (1)南京熊猫电子集团有限公司出品的熊猫M88语音手机,按键没凸出,触摸感较弱,编辑功能不适合盲人操作。 (2)多普达公司生产的多普达310盲人手机,具备普通手机的外观与按键,可用语音操控,但不具备盲文输入功能。 国外同类产品情况 (1)芬兰Nokia公司研发的软件可将将文本转化成语音,但价格昂贵。 (2)英国Alva公司设计的PDA手机采用盲人“点字法”输入,提供了20个盲人点字单元和8个点字按键。其价格昂贵,且不适合我国盲人使用。 作品技术特色与优势 (1)盲文平面化转换方法。世界上通用的Braille盲文为立体盲文,通常无法实现立体盲文输入。盲人智能手机创造性实现了Braille盲文的平面化转换及输入方法。 (2)非特定人语音指令识别技术及嵌入式系统实现。我国地域广,各地口音对语音指令、语音信息的准确度有较大影响。利用DSP实现了非特定人的语音识别与控制技术,是提高盲人智能手机实用性的关键技术。 (3)多途径盲文信息输入与信息融合技术。针对使用需求,项目组研究并建立了包括语音输入、平面盲文输入、触觉感知的多源盲文信息融合方法,提高了盲人智能手机的通用性。 (4)本作品具有完全自主知识产权,成本较低,符合我国国情。 参考文献 [1]Parnas D,Habermann A.Comment on deadlock preventive method [J].Communications of the ACM,1972,15(9):840-841. [2]McMillin BM,McMillin PY.Personal computing for the visually impaired[J].Potentials,IEEE,1989,8(2):17-20. [3]朱双六,宋文兰.盲文信息处理研究[J] .上海铁道大学学报,1996,17(4):87-92.
建议反馈 返回顶部