向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
秉持生态文明理念 促进人与自然和谐共生******
秉持生态文明理念 促进人与自然和谐共生(坚持和完善人民代表大会制度)
朱鹮野外种群从1981年的7只增加到6000余只,藏羚羊野外种群从7万只增加到约30万只,在野外一度消失的野马、麋鹿重新建立起野外种群……这些野生动物种群的恢复,离不开这些年来野生动物保护相关法律法规的保驾护航。
2022年12月30日,十三届全国人大常委会第三十八次会议表决通过了修订后的野生动物保护法,将于2023年5月1日起施行。
“此次野生动物保护法修改,为了加强对重要生态系统保护和修复,坚持保护优先、规范利用、严格监管的原则,积极回应社会关切。”全国人大常委会法工委经济法室主任岳仲明表示,新修订的野生动物保护法进一步完善野生动物保护和管理制度,加大对违法行为的处罚力度,做好与生物安全法、动物防疫法、畜牧法等相关法律的衔接,秉持生态文明理念,推动绿色发展,促进人与自然和谐共生。
科学立法、民主立法
与新形势下野生动物保护实际需要相适应
“2021年云南大象北上及返回之旅,让世界看到了我国保护野生动物的成果。”岳仲明介绍,现行野生动物保护法于1988年制定,2004年、2009年和2018年三次修正,2016年进行了修订,“现行野生动物保护法在加强野生动物及其栖息地保护和拯救繁育工作,维护生物多样性、推进生态文明建设等方面发挥了重要作用。”
2020年5月至7月,全国人大常委会组织开展了《关于全面禁止非法野生动物交易、革除滥食野生动物陋习、切实保障人民群众生命健康安全的决定》和野生动物保护法执法检查。此次执法检查的一项重要任务是评估野生动物保护法,广泛收集各方面对法律修改的意见建议,为修改完善野生动物保护法提供依据。
“检查中多地反映,现行野生动物保护法以及配套的行政法规、地方性法规与新形势下野生动物保护的实际需要不相适应。”执法检查报告显示,存在野生动物保护法与相关法律衔接不够等问题,表明相关法律制度亟待修改完善。
对此,野生动物保护法在修订过程中广泛征求和充分听取各方面意见,最大限度吸纳民意、汇聚民智,科学决策。
2020年10月,十三届全国人大常委会第二十二次会议对野生动物保护法修订草案进行了初次审议。会后,全国人大常委会法工委将修订草案印发各省(区、市)人大和中央有关部门、全国人大代表、研究机构、基层立法联系点等征求意见,并在中国人大网全文公布修订草案,征求社会公众意见。
2022年8月,野生动物保护法修订草案二次审议稿提交十三届全国人大常委会第三十六次会议审议。“会后公开征求意见期间,共收到3806位社会公众提出的12057条意见,另收到来信11封。”全国人大常委会法工委发言人臧铁伟介绍,社会公众主要就规范野生动物人工繁育、展演、放生等提出了意见建议,相关意见建议在草案三次审议稿中作了体现。
修法完成后,推动新修订的野生动物保护法实施已提上日程。岳仲明表示,国务院有关部门和地方要加快制定、完善相关配套规定,健全联合执法工作协调机制,严格执法,加强行政执法与刑事司法衔接,依法打击违法犯罪行为,实现生态环境保护和经济高质量发展双赢。
回应社会关切
加强外来物种防控、细化野生动物种群调控措施
近年来,诸如外来物种入侵、野生动物损害人身财产安全问题等新闻不时见诸媒体,引起社会关注。野生动物保护法在修订中对这些社会热点问题也予以了积极回应。
“新修订的野生动物保护法明确规定,从境外引进的野生动物物种不得违法放生、丢弃,确需将其放生至野外环境的,应当遵守有关法律法规的规定。”岳仲明介绍,发现来自境外的野生动物对生态系统造成危害的,县级以上人民政府野生动物保护等有关部门应当采取相应的安全控制措施。
北京林业大学经济管理学院教授谢屹表示,外来物种危害是全方位的,不仅导致本地物种灭绝、生态系统结构和功能改变、退化以至生态系统服务功能丧失,更严重危害到生态安全和生物安全,“应当选择适合放生地野外生存的当地物种,才能够实现因‘放’而‘生’。”
此次修法中,还增加了“国务院野生动物保护主管部门应当会同国务院有关部门加强对放生野生动物活动的规范、引导”等内容。“一些社会公众放生的出发点是好的,但放生必须尊重自然规律,做到合法有序。”武汉大学环境法研究所所长秦天宝表示,随意放生野生动物,造成他人人身、财产损害或者危害生态系统的,需要依法承担法律责任。
此次修订中,对野生动物种群调控措施的细化也成为一大看点。
近年来,随着我国生态环境持续改善,一些地方野猪等野生动物泛滥成灾,危害群众人身财产安全和农牧生产。“野生动物肇事的问题根源在于野生动物活动区域与当地群众生产生活区域的空间重叠。”谢屹表示,得益于我国多年持续重视野生动物保护工作,野生动物种群数量持续增长,但作为关键栖息地的自然保护地因为面积既定和生态承载力有限,导致了此类问题呈现加剧态势。
此次修法对野生动物种群调控措施予以细化,其中规定县级以上人民政府野生动物保护主管部门根据野生动物及其栖息地调查、监测和评估情况,对种群数量明显超过环境容量的物种,可以采取迁地保护、猎捕等种群调控措施,保障人身财产安全、生态安全和农业生产。
“根据新修订的野生动物保护法,在野生动物危及人身安全的紧急情况下,采取措施造成野生动物损害的,依法不承担法律责任。”秦天宝表示,修订后的野生动物保护法,还将中央财政对致害防控的补助范围由国家重点保护野生动物扩大到其他致害严重的陆生野生动物,“因此诸如野猪等野生动物也被纳入其中。”
凝聚各方合力
为野生动物保护公益诉讼提供直接法律依据
做好野生动物保护法实施工作需要社会各方面共同努力。近年来,随着公益诉讼制度在凝聚生态环境保护合力方面作用愈发凸显,此次修法新增的公益诉讼相关条款,对满足实践发展需要和破解制度发展瓶颈是关键一步。
“此前,依据环境保护法等法律法规,野生动物保护实际上已经‘隐含’在了公益诉讼适用的范围之内。”秦天宝表示,此次对野生动物保护法的修改,则明确为检察机关等开展野生动物保护公益诉讼提供了直接法律依据,这同时也有利于调动相关社会组织开展野生动物保护公益诉讼的积极性。
唐家河国家级自然保护区(以下简称唐家河保护区)是大熊猫的重要栖息地,属2019年1月挂牌成立的大熊猫国家公园岷山片区。2015年以来,四川省青川县某肉羊养殖场以及村民韩某某等长期在唐家河保护区内违法放牧,破坏了大熊猫及其伞护的野生动植物的生态环境,尽管唐家河保护区管理处针对上述违法行为多次向有关主管部门书面报告,但问题未能得到解决。
2020年5月,青川县检察院主动走访县内自然保护区时发现该案件线索,以行政公益诉讼立案,督促行政主管部门依法履职。同时,检察机关兼顾自然保护区生态环境保护和养殖户合法权益,推动党委政府召开专题会议研究部署养殖户退出自然保护区补偿问题,引导自然保护区原住居民利用现有资源发展乡村振兴产业中的重点项目、有偿参与国家公园管理。
“本案是中国大熊猫栖息地保护检察公益诉讼第一案,彰显检察公益诉讼制度在推进国家公园建设中的积极作用。”最高人民检察院公益诉讼检察厅厅长胡卫列介绍,自2020年以来,全国检察机关共立案办理生物多样性保护公益诉讼案件2万余件,既涉及国家保护的陆生、水生野生动植物,也涉及动物栖息地、自然保护区,以及对外来入侵物种的防治和本地重要生物种群的保护等。
“如今公益诉讼条款写入野生动物保护法,将有助于进一步加强检察机关与林业和草原、农业农村、生态环境等部门在野生动物保护方面的协作配合,形成公益保护合力。”胡卫列表示,下一步,检察机关将深入调研野生动物保护领域公益诉讼案件办理情况、制定相关办案指引,指导各级检察机关规范办理此类公益诉讼案件。
版式设计:蔡华伟
本报记者 张 璁
(文图:赵筱尘 巫邓炎)