向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
别样的散文,不一样的“文化中国”******
【从新年首期选刊看文学新气象】
别样的散文,不一样的“文化中国”
——从2023年第1期《散文(海外版)》看当下散文创作特色与趋向
作者:周新民(华中科技大学中文系教授、湖北省中国特色社会主义理论体系研究中心华中科技大学分中心研究员)
今天散文的魅力取决于思考的深度和广度,归根结底取决于叙述什么样的“文化中国”和怎样叙述“文化中国”。这决定了散文创作的气象,也左右了散文创作的趋势。由百花文艺出版社主办的《散文(海外版)》是月度散文选刊。以2023年第1期杂志为例,我们可以管窥当下散文创作的基本风貌和格局。
深入中国自身历史脉络和老百姓的日常生活
叙述中国故事是中国文学的重要母题。然而更重要的是,我们要如何讲述中国故事。这里所提到的“如何讲述”中国故事,并不是在讲述方法层面上来考虑中国故事的讲述,而是要构建一个不一样的叙述格局来讲述中国故事。之所以这样说,是因为当谈到讲述中国故事的时候,其背后有一个讲述西方故事的参照系。不仅如此,人们惯于在中西故事的等级关系之中去选择中国故事、叙述中国故事。因此,从根本上看如何讲述中国故事,不是方法论层面的话题,而是如何处理中西“故事”关系的问题。本期《散文(海外版)》的几篇散文在叙述中国故事时呈现出崭新的气象,它们深入中国自身历史脉络和老百姓的日常生活之中去找寻“文化中国”,体现了散文家叙述“文化中国”的基本立场和出发点。
胡学文的《拴在年上的记忆》所叙写的是中国老百姓耳熟能详的春节生活。与很多写春节的文学作品不一样,它所写的不是图腾式的春节,也不是仪式化的春节,而是深入中国人骨髓深处的日常化的春节。胡学文表面上不厌其烦地详细叙写春节的程式、美食等,而作品内在内容写的是深入中国人血肉之中的日常伦理与情怀,勾画出亲情至上的文化根脉。《拴在年上的记忆》讲述春节特有的“味道”。周缶工的《老屋衣马》所写的也是寻常百姓家的历史与日常。老屋是老旧中国的缩影,老屋里的芸芸众生乃是中华儿女。《老屋衣马》并没有酸腐气,而是充满了可爱,充盈着怡然自得的纲常与伦理。
《拴在年上的记忆》与《老屋衣马》这两篇散文的“新奇”在于,他们客观还原“老中国”的方式,不是夸张的,也不是居高临下的,而是贴近历史的、烟火气的,它力求写出一个“客观的中国”。这里的“客观的中国”并不符合某种先验的观点,而是深入中国人的血脉之中,展现其历史的自洽性。所以,两位作者在叙写春节、老屋这样的常规题材时,才能如此心平气和、娓娓道来。
其实,两篇散文能如此平静地“叙述中国”,自然是参照中国故事的角度和标准发生了变化。原来那种图腾式、仪式化地叙述中国的方式,是由其所参照的西方预设的文化等级所决定的。以西方现代性为视角来叙述中国故事,中国故事则充满了猎奇,甚至夸张与扭曲,行文之时难免有剑拔弩张之气,自然就难以心平气和地叙述。叙事思维的调整,不仅能让散文在叙述中国故事时呈现出豁达、自然的气象,更重要的是,散文所观照的人和事的价值观也发生了变化。穆欣欣的《把日子往前过才是幸福——红楼人物刘姥姥》体现了这种转化的趋势。《红楼梦》中的刘姥姥是中国人都很熟悉的人物形象,在很多读者眼里,她笨拙的言行与不合时宜的思想,是那样充满喜剧感。之所以会出现这种现象,无非是人们习惯性地从高处出发来审视刘姥姥。然而,如果贴近中国老百姓的生活,尤其贴近老百姓“过日子”的人生伦常来看待刘姥姥,我们就会发现刘姥姥身上所迸发出来的坚韧、宽厚,散发出耀眼的人性光辉。
段爱松的《斑斓捕梦人——我与外国文学之缘》的思路与《把日子往前过才是幸福——红楼人物刘姥姥》有异曲同工之妙。它所讨论的主要话题是中外文学关系。说起中国作家与外国文学之间的关系,习见的叙述是讲述中国作家如何受到外国作家、作品的影响。然而,这篇散文的叙述思路却与众不同,它以中外文学经典之间的“互通”与“互鉴”作为叙述的思路,仔细地叙述了《红楼梦》与《浮士德》之间的“互鉴”之处。同时,它也在陈子昂的《登幽州台歌》、柳永的《雨霖铃·秋别》、温庭筠的《菩萨蛮·雨晴夜合玲珑日》、马致远的《天净沙·秋思》和普鲁斯特的《追忆似水年华》之间找到“互通性”。
给传统审美意识注入当下性
描写山水田园是中国散文固有之重要领域,也为后世留下了大量令人称道的优秀篇章。此类散文借景抒情,以景、物甚至山水田园寄予作者的思想情感和道德理想。这样的写物抒情方式之所以长盛不衰,是因为它们和中国传统审美观相联系。中国早期的比德、畅神审美意识,都深刻地影响了中国散文创作的发展。当下散文创作仍注重表现比德的审美意识和畅神的审美理想,这也是表现“文化中国”的主要方式。
马晓燕的《在花朵中念与痛》以比德的审美意识来表现当代人应该坚守的价值观。马晓燕以槐花来表现人要活成自己想要的样子,以玉兰来体现不流于世俗的价值追求,以牵牛花来表现对于淳朴心灵的向往。黄丹丹的《我的植物故交》在更为深邃的哲思层面来建立“物”同“人”的关系。文章通过对蓼、雪见草、马泡秧子、狗尾草、三棱草、野苋菜、美人蕉、凤仙花、矢车菊、六道木等植物的细心观察,对植物物性进行不厌其烦的书写,无非是要恢复人类认知植物的各种能力,重新找回人和自然之间的关系。作为自然的一部分,人和植物本来就是共同享受自然界的阳光与雨露,只不过人类社会的发展让人类和自然相远离,人与自然相阻隔。黄丹丹从植物与人的关系入手,期望重建人和自然之间平等、和谐的关系。
以物观人是中国传统审美方式。这种审美方式的确立和中国古典美学的“天人合一”的审美观念紧密联系在一起。物我相连、物我一体是中华优秀传统文化非常宝贵的价值观念,尤其在物质高度发展的时代,为了避免功利主义给人带来伤害,重新回归“天人合一”价值观,自然有其重要价值和意义。“天人合一”最有价值之处在于从“物”与“人”的系统性关系出发来处理“物”与“人”的关系,而不是简单地以“物”为中心,或者简单地以“人”为中心。葛小明的《大树独立街头》以几棵树的命运为参照对象,深入思考这一问题。小区栾树出油,业主要求物业一砍了事,但没有想到夏天无荫可憩息的烦恼。人们只想到大树患病,粗暴治理,没想到生态平衡遭到破坏。葛小明以物及人,言明人同树木,是一棵行走的大树。大树离开自己的生态系统难以存活。人类又何尝不是生存在生态系统之中呢?
虽然皈依于传统审美意识和传统的观物之审美方式,能写出令人沉醉的散文作品,但是,毕竟时代在发展,如何在当下语境中去扩展传统审美意识,给传统审美意识注入当下性,也值得散文家深思。谢宗玉的《江南江北,尽是潇湘意象》可谓是其中具有典范性的作品。“潇湘八景”经过历代文人墨客的渲染,已经蔚然成为中国传统文化重要的美学旨趣。借助现代科学技术复原,“潇湘八景”令人流连忘返。然而,作者的笔触不是去歌颂“潇湘八景”的审美旨趣,而是格外冷静地剖析了“潇湘八景”形成与流变的历史原因,指出“潇湘八景”实际上包含了消极甚至病态的审美心理。于是,作者发出呼吁,要开文化新路,避免文化陷阱,不要盲目“鼓吹那些旧意象”。叶青的《一座山何以成名》也是从理性的眼光来审视中国历史与文化。与一般作品在书写名山大川的时候不加思考地膜拜名山大川的文化传说与掌故不同,《一座山何以成名》的可贵之处在于科学、理智地看待麻姑山成名的原因:自然造化与历史赋予。《一座山何以成名》告诉我们,名山大川文化的沉淀当然是我们应该珍视的文化传统,但是,尊重、弘扬传统文化,一定要有科学分析的过程。
书写亲情又不止步于表现亲情
人们常说中国以家庭为本位,中国人格外重视家庭伦理,形成了尊亲爱幼的传统美德。因此,叙写父辈与子辈之关系是散文创作亘古未变的主题。这一类主题既包括书写晚辈对于父爱母爱的赞扬,也有舐犊情深的流露。然而,要写出新意,难度自然很大。本期《散文(海外版)》在亲情书写上也有探索:书写亲情但是又不止步于亲情。探索的路径概而言之有两种。一是以沈念的《长路和短句》、江子的《燃爆记》、田鑫的《河流的几种形式》为代表,着重从“纵向”的历史角度叙述“父”与“子”的关系与情感;二是以任芙康的《父亲》、冯帆的《多年父子成朋友》、王韵的《夜苍茫》为代表,着重从“横向”的角度书写人与人之间的关系。
《长路和短句》刻画了一位乡村干部致力于改造乡村的简史。父亲年轻时致力于“移山”,为乡村增加耕地面积,他以不可思议的方式,用愚公移山的精神来“移山”。后来父亲出任村支书,以“诡计”引来县委书记走山寨的烂泥路,为山寨争取到了修路资金。如果是仅如此记述一位乡村干部的历史,显然没有多大价值。作者巧妙地插入儿子“他”的视角,从父与子的关系中来叙述这一段历史。把父亲对儿子的影响史,作为《长路与短句》的内在叙述线索,增加了作品的思想性和艺术性。江子的《燃爆记》似乎只是写个人的家庭小事,刻画了一位吝啬、脾气暴躁、不讲感情的母亲形象。《燃爆记》的价值在于,它把母子关系置于历史流变宏阔的背景中去思考。在城市禁止燃放爆竹的时代,母亲为了给儿子一家出行祈求平安,执意燃放鞭炮,是多么的不合时宜。然而,这是她难得释放对子女、家庭的情感的机会。时代巨变之中的“不合时宜”,虽然不具备历史价值,但是具备宝贵的伦理价值。这是《燃爆记》要表达的主旨。田鑫的《河流的几种形式》表面上写祖父与姑姑、叔叔,父亲与“我”之间的亲情与羁绊。实质上所写的是在祖孙三代的时光流变之中的亲子之情。作者在叙述之中以回溯的叙述方式来表现对于“根”的回望。
上述几篇散文侧重在历史纵向关系中书写亲情,避免了平面叙述的诟病。除了在纵向上开掘之外,这期《散文(海外版)》还有一些散文注重在横向的社会关系中去扩展亲情的书写内涵。“父”与“子”不再是书写父辈形象的载体,而是观察社会、洞悉人心的一种方式。任芙康的《父亲》表面上是围绕父亲和“我”之间关系来书写父子情。父子情固然是文章要表现的内容,但是,以“我”之眼,书写一位与他人交往中体现出品行高洁、“雍容”的父亲人生过往,才是《父亲》的本意。冯帆的《多年父子成朋友》不是简单地歌颂父亲,而是以父与子之间的“朋友”关系为纽带,既书写了父与子之间的深情,也刻画了一位私德上的孝子、工作上敬业的父亲形象。《父亲》《多年父子成朋友》不再拘囿于父子之间,而是从更广阔的社会关系之中刻画“父亲”的形象。王韵的《夜苍茫》是倾向私人情感的书写。二姨让独子学平参军,儿子参军后,她非常思念儿子。儿子学平也是非常思念母亲,除夕之夜冒着风雪步行二十多公里去县城给母亲打电话报平安。由于思亲心切,学平渐渐神志不清。后来全靠二姨独自一人照料。然而,文章还不是简单的“母”与“子”之间的深情书写。这样的私人情感在作品之中完成了一个重要的转换。文章有机地融合了“我”的情感。“我”和学平相约,隐瞒除夕雪夜步行打电话的一事,以免增加二姨的内疚之情。文章在这里把单向度的母子之间的私人情感书写,横向迁移至社会关系之上,使二姨与学平之间的感情溢出了家庭内部,构成了一部由爱环绕的社会生活图景。这是《夜茫茫》感人之处,也是它的价值之所在。
作为一种比较成熟的文体,散文创作要突破、要创新实属不易。不过,从《散文(海外版)》2023年第1期的作品来看,散文家们在顺应时代之变、在创作中寻求变化和创新上,还是很有成绩的。
《光明日报》( 2023年01月04日 14版)