找回密码 注册

基本信息

项目名称:
智能化网络敏感图像识别软件及其应用
小类:
信息技术
简介:
作品为一套用于互联网数据中心的智能化网络敏感图像识别(INEIR)软件。该软件在充分分析网络敏感图像的视觉特性之上,利用计算机视觉、图像处理、人工智能和模式识别等领域相关知识,通过采用软硬件结合的数据获取技术、基于小类模型的快速匹配机制、融合智能化技术与人类视觉感知的分层识别策略等,准确地从海量的网络信息资源中识别出包含色情内容的图像信息,填补了国内服务器端的图像内容识别与过滤产品的市场空白。
详细介绍:
全球网络化已极大地改变了人类的文化和生活方式,同时亦对各国政府的网络治理工作提出了巨大的挑战。如今网络敏感信息的传播愈来愈严重,不良网络文化对网民尤其是青少年的身心造成了极大的危害。本作品研发了一套可用于IDC(Internet Data Center,互联网数据中心)的智能化网络敏感图像识别(Intelligent Network Erotic Image Recognition,INEIR)软件,填补了国内服务器端的图像内容识别与过滤产品的市场空白。INEIR软件通过面向特定图像的建模与快速匹配机制、基于智能化方法和人类视觉感知的图像分层识别策略、以及软硬件结合的高速数据流解析技术等,快速地从海量的网络信息资源中识别出包含有色情内容的图像信息。上海移动和浙江电信两个省级IDC的测试和使用情况表明,INEIR软件技术手段先进、系统稳定可靠、识别性能和识别准确率高,具备广阔的应用前景。未来三年我们将重点研发一套整合网络文本、图像、视频等敏感信息的识别系统,以提供一系列更专业的解决方案,并将逐渐开放我们的系统平台,希望吸引更多有志于改善中国互联网环境的师友们加入这更高的挑战。

作品图片

  • 智能化网络敏感图像识别软件及其应用
  • 智能化网络敏感图像识别软件及其应用
  • 智能化网络敏感图像识别软件及其应用
  • 智能化网络敏感图像识别软件及其应用
  • 智能化网络敏感图像识别软件及其应用

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

一、目的 互联网上敏感信息的大肆传播,严重影响了青少年的健康成长。网络信息过滤既是各国政府急需解决的难题,也是国内外研究者的技术挑战。智能化网络敏感图像识别(INEIR)软件是一套服务器端的敏感图像识别软件。该软件从高速网络数据流中获取图像数据,能够从海量的WEB信息资源中过滤包含色情内容的敏感图像信息。 二、基本思路 INEIR软件的研发利用了图像处理、计算机视觉、人工智能和模式识别等领域的知识与技术。我们在设计好系统的总体框架,涉及的软硬件配置,以及主要功能模块后,采用自顶向下、逐步细化的软件开发过程对系统的各个环节与模块进行具体化,并编程实现了整个系统。 三、创新点 1)采用了面向特定图像的快速匹配机制; 2)采用了先进的智能化技术与手段; 3)采用了基于人类视觉感知原理的分层识别策略; 4)采用了软硬件相结合的数据获取技术。 四、关键技术 1)基于软硬件结合的网络数据流解析; 2)基于各种引擎的图像预处理; 3)基于特定图像的小类模型建立及快速模型匹配; 4)基于人类视觉感知的自动检测; 5)基于支持向量机(SVM)的智能分类器; 6)基于人机交互的交叉反馈机制。 五、主要技术指标 1)支持通用图像格式; 2)敏感图像的正识率≥95%,误识率≤5%; 3)正常图像的正识率≥95%,误识率≤5%; 4)图像识别的速度≥800幅/分钟; 5)执行时对CPU平均利用率负荷增加不超过5%,峰值增加不超过40%,内存消耗不高于128MB。

科学性、先进性

INEIR软件通过面向特定图像的建模与快速匹配机制、基于智能化方法和人类视觉感知的图像分层识别策略、以及软硬件结合的高速数据流解析技术等,快速地从海量的网络信息资源中识别出包含有色情内容的图像信息。INEIR软件填补了国内服务器端的图像内容识别与过滤产品的市场空白。上海移动和浙江电信两个省级IDC的测试和使用情况表明,INEIR软件技术手段先进、系统稳定可靠、识别性能和识别准确率高,具备广阔的应用前景。INEIR软件与“绿坝-花季护航”核心模块的性能对比结果表明,前者已达到国内先进水平。

获奖情况及鉴定结果

2011年5月,荣获省第十二届“挑战杯”大学生课外学术科技作品竞赛特等奖。

作品所处阶段

软件产品已经研发成功,目前在上海移动、浙江电信等大型IDC机房应用。

技术转让方式

目前已经与两家电信服务商签订了项目合同,合同金额80万元,产品同时以增值业务的形式获得分红。

作品可展示的形式

软件、现场演示、录像。

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

INEIR软件可作为服务器端的网络信息识别软件,满足通信运营商对网络数据内容审核的应用需求,系统部署在大中型IDC机房中,用来实时扫描网络重要节点上流经的所有网络信息。相对于基于客户端的工作方式,INEIR软件采用的基于服务器端的方式,收益面大、针对性强,过滤效果好。 INEIR软件亦可作为通信运营商的增值服务产品,或作为各级学校、政府、企事业单位、网络公司的网络数据中心的网络监管系统。INEIR软件的关键技术和核心算法还可拓展到其它潜在的应用领域,例如:视频监控、人脸追踪、手势识别、安全防控、医疗保健等。 INEIR软件的主要收益来自两部分:独立软件(或作为子模块)销售收入和通信运营商的增值服务分账收益。

同类课题研究水平概述

据不完全统计,自上世纪末以来,我国的敏感信息过滤软件已超过20种。例如:“网络爸爸”、“科利华学生浏览器”、“美萍反黄专家”和“火眼金睛”等。这类过滤软件大多采用的是黑名单过滤技术或关键字过滤技术。尽管“反黄卫士”和“护花使者”等过滤软件利用了简单的图像处理方法,但依旧无法对图像的内容作智能化识别与过滤。 图像比文字信息更丰富,网络敏感图像比敏感文字危害更大。基于内容分析的图像识别是敏感图像过滤的关键环节,也是长期以来基于内容的图像检索(CBIR)领域的研究重点。例如:IBM研究中心开发的QBIC系统,允许使用示例图像、用户构建的草图等,实现图像的检索。MIT媒体实验室开发的PhotoBook系统,可根据人脸、形状或纹理特征对图像进行自动分类,哥伦比亚大学推出的VisualSEEK系统,实现了网络图像、视频信息的检索。此外,还有许多类似的检索系统,如伊利诺伊大学的MARS系统,卡内基美隆大学的Informedia系统,以及哥伦比亚大学的VideoQ系统等。 如今将基于内容分析的图像识别应用到敏感信息过滤中受到研究者关注,主要有两种策略:一是通过分析图像中人体的内容(如肢体),根据模板或设定的规则来区分敏感图像和正常图像;二是从图像中提取出特征,经过处理后组成特征向量,用特征向量检测敏感图像。目前,后一种策略为主流。例如:美国衣阿华大学的Fleck和加洲大学伯克利分校的Forsyth等人,通过基于肤色的图像分割和人体姿态的几何特征检测,判断图像中是否包含裸露的人体。斯坦福大学的Wang等人,利用结合小波纹理和颜色直方图的特征向量识别敏感图像中的裸体区域。英国阿伯丁大学的Craw等人,采用自组织映射(SOM)建立肤色模型,通过肤色概率值来鉴别肤色像素点。 上述识别方法利用机器学习手段,从大量敏感图像样本中发现该类图像在视觉上的特性,利用这些特性去分析判断测试图像。如敏感图像识别以判别图像中裸体面积的大小为判别准则。但互联网上的图像来源各异,成像条件千差万别,由于人类主观感觉的存在,使得对图像语义特征的抽取存在一定的非客观因素。按我国工信部对“淫秽色情图像”的定义,裸体图像仅仅是敏感图像的子类,如包含色情姿态和行为的图像、网络卖淫的图像等都定义为敏感图像。因此,亟需研发一套适用于互联网环境下的高效、实用、具有智能化的网络敏感图像识别软件。
建议反馈 返回顶部