——北京数字经济企业见闻之四
五道口地区是北京市最繁忙的科技创新“高地”之一,高楼林立、交通繁忙、人流如织。这里聚集了大量的高校学府、科研院所、商业机构和金融机构,经济活跃,吸引了海内外学者、学子,科研人员和商务人士前来。无论是白天还是夜晚,五道口都是一片忙碌的景象,展现着现代都市数字经济快速发展的繁荣和活力。
在成府路上,一栋由红砖包裹着的7层小楼显得格外抢眼,它是北京智源人工智能研究院(下称“智源院”)的所在地,就在这栋红砖楼里诞生了中国首个大模型。今年初,横空出世,火遍全球的ChatGPT正是基于大模型训练出来的一种语言生成模型。因大模型具有划时代的意义,被业界认为是未来数字经济发展的“第二大脑”。今天就跟随记者的脚步走进中国的“第二大脑”,一睹人工智能创造出的奇幻空间。
机器狗、机械臂技术哪家强
时下,机器狗、机械臂等智能设备,因为其“颜值高”、造型奇特、轻巧灵活等特点不仅成为各类科技创新成果博览会的“常客”,也收获了一批“粉迷”的点赞,更为全社会所熟知。但如果要论机器狗、机械臂技术哪家强,还得看智源院的两款装备。
在智源院5楼的一间研发室内,一台造型“呆萌”的机械狗趴在地板上,这只呆萌的狗背上展出一只可折叠的机械臂,狗头上还有一台高精度摄像机。研究人员启动这台机器狗后,它能完成前进、后退、跳跃、翻滚等动作,还可以伸开背上的机械臂抓取物品。
该研发室负责人介绍,我们的机器狗、机械臂操作平台基于国产宇树机器狗和机械臂开发,并搭建了高频同步的多视角深度相机、激光里程计等传感设备。通过我们自主研发的高度泛化的主动式建图、寻物导航和移动操作算法,这些设备能够在未知环境寻找和抓取未知物体。
什么是抓取未知物体,在研发室一角的实验平台上,技术人员在实验区的框中放入十多个透明矿泉水瓶子,机械手臂毫不费力地抓取这些“看不见”的瓶子,并根据瓶子的规格分类。据介绍,这款机械臂通过大规模基于视觉的强化学习可以有效识别透明物体,完成分类捡装。
“通过从仿真到真实的迁移,机械狗、机械臂所习得的能力可以直接泛化到真实场景,使得这些智能设备具有在未来广泛应用于各种家庭和商业场景的潜力。目前,我们的相关研究成果已在该领域国际顶级会议上发表。”该研发室负责人说。
作为新型研发机构,智源院初步探索了“集中力量办大事,青年人才挑大梁,开放生态育创新”的智源模式。凭借五道口地区学术科研资源“近水楼台先得月”的优势,智源院致力于推动人工智能领域发展政策、学术思想、理论基础、顶尖人才与产业生态的五大源头创新,为北京人工智能产业发展和深度应用,改善人民群众生活、促进社会、环境和智能的可持续发展贡献力量。
无所不能的大模型
走进大楼4楼办公区的一间小型会议室,让记者顿时产生穿越之感,仿佛来到了医院的诊断室。只见一名工作人员侧卧在一张医疗床上,旁边一台机器触手正在这名工作人员的心脏部位的胸部表面来回移动。在床尾的电脑显示屏上,动态显示机器触手捕获到被测目标的心脏跳动画面,画面类似于超声波检测图像。这是智源院科研人员通过大模型开展的一个医疗检测科研应用项目。
该项目负责人贾宁介绍,这个项目研究的主要目标为研发自主超声扫描机器人,能够自动或半自动地完成心脏、心血管等人体器官的超声扫描完整流程。围绕这一目标,研发人员主要来自从事视觉感知、机械臂柔顺控制以及强化决策的三个研究领域,此外,项目研究中还包括了图像处理、目标检测、语义分割、图像分类、人机协同、世界模型等研究方向,并将这些子模块集成为一套完备的系统。
这项研究将给医疗创新带来哪些革命性的变革?贾宁介绍,“心脏检测是医疗检测领域对医生专业性要求极高的工作,我们通过大数据分析模型,训练人工智能机械手臂这项能力,研发成功后将大大提高心脏检测的效率,减少人为因素对检测结果的影响。”
类似于通过大模型训练智能机器触手对人类心脏部位开展医学检测的研究,在智源院大楼内还有很多,诸如研究生物蛋白分子结构,研究病毒表面蛋白分子结构等,每一项应用场景拓展方向,都以大模型为核心。显示出数字技术在科技创新中的作用愈加显著,同时,大模型在民生经济领域的应用前景非常广阔。
智源院相关负责人介绍,智源院作为一个非盈利的平台型研究机构,一直致力于通过开源开放的方式发布系列大模型,包括数据集、算法、算力、工具等。
华智冰是一位“AI+3D投影”的虚拟数字人,这位由清华大学计算机系知识工程实验室推出的虚拟数字人,已经办理了学生证,成为清华大学的一名“学生”。这名学生的特殊之处在于,其接入了智源院研发的悟道2.0大模型。在不断训练过程中,华智冰不但会创作诗歌、绘画,还学会了编程,并且很快成为与众不同的“科研人员”,虚拟数字人遇上大模型有了真正的“才华”。
目前,智源院已经推出悟道3.0大模型系列,它不仅创造了“中国首个+世界最大”的纪录,更充分展现了智源坚持开源开放的决心。
数字经济发展的“智囊团”
在智源院采访中,当讨论到大模型对于北京数字经济发展作用的话题时,智源院院长黄铁军打开了“话匣子”,他表示,大模型就像是数字经济发展的“智囊团”。大模型可以通过分析海量数据、挖掘潜在规律和趋势,为北京的数字经济提供决策支持和智慧。大模型的分析和预测能力,可以帮助企业和政府更好地把握市场动向、优化资源配置、提高生产效率,从而推动北京数字经济的高质量发展。
黄铁军说,“数据可以说是AI大模型最重要的一个要素,大家认识不同,但是总的来说几乎所有人都认为数据的质量对模型智能水平影响最高,差不多要超过60%。”
研究人员正在用大模型分析蛋白质的分子结构
在民生经济领域,大模型具有广阔的应用前景。通过大模型,可以对民生领域的消费需求、消费习惯、健康状况等进行深入分析,为政府和企业提供更精准的决策支持。例如,可以通过大模型来优化城市交通规划,改善交通拥堵问题;在医疗健康领域,大模型可以帮助医疗机构进行疾病预测和个性化治疗方案制定;在教育领域,可以通过大模型来提供个性化的教育方案,满足学生的学习需求。
人工智能还可以促进创新创业,推动科技创新和产业升级,为北京数字经济的高质量发展注入新的动力。通过人工智能技术的应用,可以提升北京的经济发展水平,推动数字经济的高质量发展。
在服务北京中小科技创业企业场景落地方面,悟道3.0大模型平台已经帮助美团、OPPO等上百家企业在相关业务领域实现了降本增效。在推动北京政务服务效能提升方面,大模型也在感知民生状况、优化福利政策等方面“大显神通”,有效提高社会公平和民生福祉。(记者 韩鹏飞 富宇)
(来源:中宏网)