基本信息
- 项目名称:
- 基于泛在网的智能搜索引擎
- 来源:
- 第十二届“挑战杯”省赛作品
- 小类:
- 信息技术
- 大类:
- 科技发明制作B类
- 简介:
- 本作品以实际需求为研究导向,以无处不在的泛在网为研究背景,以语音交互、物联网信息搜索、基于内容的多媒体信息搜索、多层次改善用户体验为主要创新点,结合了框计算、云计算、整合搜索以及TTS、STT等先进技术,研究并实现一种可以在泛在网范围内快速搜索信息的智能搜索引擎,为用户提供最需要的信息,而且系统还提供了更加人性化的语音交互服务。
- 详细介绍:
- 由于移动通信网、互联网、物联网之间相互协同融合是未来泛在网发展的最终目标,而且物联网可以看作是将各种信息传感设备及系统,如传感器网络、射频标签阅读装置、全球定位系统和其它基于物-物通信模式(M2M)的短距无线自组织网络,通过各种接入网与互联网结合起来而形成的一个巨大智能网络,具有很大的发展潜力,而且物联网范围内的信息具有很强的实时性。因此,本系统首先研究利用高性能的多主题分布式搜索引擎从泛在网范围内不断爬取各种格式的数据信息,并对信息进行分析和处理后建立多主题索引库,这样就可以在利用框计算或者相关的策略对用户的搜索意图进行理解后,直接到对应的主题索引库搜索相关信息,或者到物联网上搜索一些传感器的实时信息,在这个过程中需要利用云计算等技术提高搜索引擎的性能。 在实现上述功能的基础上,为了改善用户体验和方便特定人群使用本系统,还需进一步研究语音控制、语音报读搜索结果、整合搜索等更加人性化的功能。
作品专业信息
设计、发明的目的和基本思路、创新点、技术关键和主要技术指标
- 研究目标:本系统是以现有搜索引擎技术为基础,以泛在网为研究背景,结合目前流行的框计算、云计算、普适计算等先进技术,研究并实现基于泛在网的智能搜索引擎系统,系统中需要集成基于内容的多媒体信息搜索、整合搜索等功能。同时,系统要具有语音控制、语音报读搜索结果等功能。 设计思路:首先利用多主题分布式搜索引擎在泛在网环境内不断爬取丰富的数据信息,通过对数据进行分析建立多主题索引库。然后,利用框计算和数据挖掘等技术对用户提交的关键词进行语义分析和理解,并为用户提供准确的搜索结果。在这个过程中,系统需要利用云计算、云存储等先进的技术来支撑系统完成信息的智能搜索服务。另外,本作品进一步研究并实现基于内容的多媒体信息搜索、自定义垂直搜索、物联网实时信息搜索等服务,实现语音交互功能。 创新之处:(1) 系统支持实时传感信息的搜索服务;(2) 多主题分布式网络爬虫;(3) 语音控制和语音报读;(4) 提高系统的智能性;(5) 基于内容的多媒体信息搜索;(6) 中文分词结果的词性标注算法改进;(7) 利用云存储技术提高系统的性能 关键技术:解决如何从泛在网范围内爬取尽可能丰富的信息问题;利用云计算和框计算等技术来提高系统性能;在系统中添加基于内容的多媒体信息搜索、语音识别、语音播报等服务。主要技术指标:(1) 语音识别准确率达到90%以上;(2) 文本信息搜索的系统响应时间在0.2s以内;(3) 基于内容的图像搜索系统响应时间在2s以内;(4) 系统支持不同浏览器之间的兼容;
科学性、先进性
- 传统的搜索引擎主要通过网络搜索软件或网站登录方式将WWW上大量网站的页面信息收集到本地,经过加工处理后建成数据库,从而能够对用户提出的各种查询请求作出响应,并提供用户所需要信息的来源。 本作品是以传统搜索引擎技术为基础,以基于泛在网的搜索引擎为研究对象和研究目标,结合了云计算、框计算、TTS、STT、基于内容的多媒体信息搜索等先进的技术,不仅提高了系统的性能,还改善了用户的体验,并为用户提供了许多更加个性化和人性化的服务。 同传统的搜索引擎技术相比,本作品的主要创新之处在于对搜索引擎进行了智能化方面的研究,并试图构建一种基于泛在网的智能搜索引擎,有别于传统搜索引擎模型的研究,而是赋予学科新的研究思路和视角,通过科学整理和系统研究,能够发现更多创新性的科学结论,同时启发已有技术的研究思路。
获奖情况及鉴定结果
- 本系统的雏形在重庆邮电大学2010年研究生网站创新设计大赛中,获得最佳创意奖以及优胜奖。
作品所处阶段
- 中试阶段
技术转让方式
- 具体转让方式再协商
作品可展示的形式
- 实物、录像、图片。
使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测
- 本项目是以现有搜索引擎的相关技术为基础,这样在一定程度上提高了系统设计和开发的可行性。另一方面,本系统以泛在网为研究对象,并结合目前比较流行的框计算、云计算等先进技术,突破了传统搜索引擎的局限性,在技术上具有很强的创新性。 同时,系统中集成了搜索整合、基于内容的多媒体信息搜索、语音输入、语音报读搜索结果等多种功能,为用户提供最需要的信息和服务,而且也改善了用户体验,因此系统在功能上具有很强的实用性。 本项目主要是研究基于泛在网的智能搜索引擎,因此系统的适用范围主要是基于泛在网的信息搜索服务,并要尽可能地改善用户体验。 搜索引擎具有广泛的市场需求,虽然目前物联网还处于一个快速成长的阶段,但物联网是泛在网发展的物联阶段,通信网、互联网、物联网之间相互协同融合才是泛在网发展的最终目标。因此传统的搜索引擎将不能满足人们的需求,而基于物联网的智能搜索引擎将成为人们关注的重点,具有十分广阔的推广前景和良好的市场价值。
同类课题研究水平概述
- 随着网络信息的日益增长,以人工分类整理的搜索引擎已经不能满足用户搜索信息的要求。自1998年开始,出现了一个搜索引擎空前繁荣的时期。随着Google的出现,第二代搜索引擎诞生。它们不仅拓展了搜索引擎的生存空间,而且还极大的提高了搜索的质量和效率。除Google外,Yahoo!在2004年也推出了自己的第二代搜索引擎——“一搜”(Yiso)。在国内,百度逐渐取代新浪、搜狐,成为中文第二代搜索引擎的老大。第二代搜索引擎中最具代表性、最成功的还是Google。总的来说,第二代搜索引擎依靠机器抓取,建立在超链分析基础之上,提高了查准率、查全率和检索速度。 2003年8月20日,中国搜索CEO陈沛首次提出了第三代搜索引擎的概念。2004年12月,中国搜索推出的网络猪3.0被陈沛看成是第三代搜索引擎个性化信息门户的开始。 2006年4月18日,中国搜索发布了客户端搜索软件IG(Internet Gateway),而IG是网络猪的升级产品。另外,2004年8月,搜狐CEO张朝阳也提出了第三代互动搜索概念。 2005年9月,美国政府提出开始研制第三代搜索引擎。2005年10月,微软公布了该公司做第三代搜索引擎的构想。2007年4月,中国Jwmguagua率先提出了第三代直潜全能搜索引擎技术系统。经过5 年多的探索之后,全球第三代搜索引擎呈现出两个发展方向:一个是以Google为主的“技术驱动型”理念;一个是以Jwmguagua为主的“服务驱动型”理念。