参观登记
AI创新|展厅智能讲解人形机器人、文心生图少幻觉、豆包一句话P图、星辰语音音色超拟人……

发布时间:2024-11-15

看点概览:

一、展厅智能讲解人形机器人来了,一站式导览

二、人形机器人赛道又迎一强势玩家,通用类脑智能设计

三、文心iRAG生图少幻觉,“秒哒”助力每个程序梦想

四、豆包上线一句话P图新功能

五、TeleAI 星辰语音,超拟人音色生成

 

一、展厅智能讲解人形机器人来了,一站式导览

乐聚机器人.gif

(来源:乐聚机器人)

KURVO展厅版高动态机器人是搭载可训练大模型的全自主智能讲解机器人,功能包括地图构建、定点讲解、定位导航、拟人动作、动态避障、语音问答、自定义语音、大模型对话等。超级智能体已接入多模态大模型;展馆助手,全流程一站式导览服务;83+语种导览全能接待;可换电设计,1*24小时无惧续航;自由配置,一键布控便捷使用……可应用于学校展厅、机构展厅、政府展厅、文旅展厅、企业展厅、博物馆、科技馆、研学基地等。

 

内容详情:面向展厅场景,“智能讲解”人形机器人来了!


二、人形机器人赛道又迎一强势玩家,通用类脑智能设计

灵宝.gif

(来源:灵宝CASBOT)

11月13日,灵宝 CASBOT 这一新兴品牌重磅发布了其精心打造的首款全尺寸双足人形机器人——“CASBOT 01”,这款机器人具备多场景应用的通用类脑智能设计与稳定可靠的软硬件平台。

 

这款被亲切地称为“星期三”的人形机器人,拥有 179 cm的身高和 60 kg的体重,全身自由度 52 个,算力高达 550 T,续航时间更是超过了 4 小时。其外观经过精心设计,与人类更为亲近,能够自如地进行双足站立和稳定行走,并具备多种生活技能,从发布视频可以看到,机器人能够整理衣物、组装台灯、更换灯泡,甚至进行精细的打螺丝操作。

 

内容详情:人形机器人赛道又迎一强势玩家!以应用级人形机器人新品 CASBOT 01 搅动千亿市场


三、文心iRAG生图少幻觉,“秒哒”助力每个程序梦想


11月12日,百度发布两大赋能应用的AI技术——检索增强的文生图技术(iRAG)和无代码工具“秒哒”。

 

文心iRAG用于解决大模型在图片生成上的幻觉问题,目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”。检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。


百度iRAG.png

(一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题)

百度iRAG 2.png

(“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片)

(图源:百度AI)

无代码技术“秒哒”让每个人都拥有程序员的能力,不用写代码就能实现任意想法。其涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。

秒哒.gif

秒哒2.gif

秒哒3.gif

秒哒4.gif

秒哒5.gif

秒哒6.gif

秒哒7.gif

秒哒8.png

(以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发)


内容详情:文心iRAG和无代码“秒哒”发布!李彦宏:即将迎来AI应用的群星闪耀时刻


 

四、豆包上线一句话P图新功能

 

11月11日,豆包电脑版上线了一项新功能,打开doubao.com,生成图片后,选择“继续编辑”,输入一句简单的指令,就能实现一键P图,也可以通过“参考图”入口上传图片进行二次加工。


豆包.png      豆包2.png

                    指令:金发碧眼长发扎着双马尾,有着小雀斑的女生。  指令:有一缕阳光照射在女孩的侧脸


豆包3.png    豆包4.png

                  一对恩爱的老年夫妻,并肩站在一起。          两个人换上牛仔外套,爷爷戴上牛仔帽,爷爷的衬衣变成蓝色。



(图源:豆包)

 

内容详情:豆包这个新功能,帮你一句话轻松P图


 

五、TeleAI 星辰语音,超拟人音色生成


一些银行、外卖的客服,直接语音打电话,接起后操着一口浓郁的“机械风”,一听就是录好的话术,连中间的停顿都可以读出秒来。随着大语言模型(LLM)技术的引入,AI 可以更准确地理解用户的需求,并与之交互,但受限于传统语音合成(TTS)技术缺乏情感、流畅度差等问题,总是让智能客服的声音少了点“人情味儿”。

 

中国电信人工智能研究院(TeleAI)创新推出自主研发的“超自然语音生成”技术,让星辰语音大模型不仅可以听懂用户说话,还能以高度拟人的声音与之对话和交流。基于此,星辰语音大模型将情感丰富、自然流畅、多样音色等众多优势集于一身,还支持普通话、方言、英语等多种语言混说。

 

话不多说,上效果:

语音模型.gif

(来源:中国电信人工智能研究院)

TeleAI 星辰语音大模型全新升级了“超多方言识别”能力,方言种类提升至40种,并支持中英混说。除了“听”方言,星辰语音大模型还能“说”方言。

 

内容详情:人工?智能?傻傻分不清楚!TeleAI 星辰语音大模型推出“超自然语音生成”技术

 

AI 创新|分享人工智能领域的技术革新和创新应用的新动态,与读者共同关注AI领域的创新思维与实践。

 

AI美图


fetch_7437042795764909062 (1).png



联系我们
大会合作
王慧君 13392892806
参展咨询
周龙杰 13005498586
唐剑铭 15818569461
企业合作
陈先生 18676385933
观众咨询
于先生 15622808307
组织机构
主办单位:
深圳市人工智能产业协会
承办单位:
深圳市物联传媒有限公司、深圳鹏城会展传媒有限公司
联合承办:
中国人工智能学会、中国自动化学会、香港物联网协会、北京人工智能学会、上海市人工智能行业协会、上海市人工智能技术协会、广东省人工智能产业协会、湖北省人工智能学会、杭州市人工智能学会、江苏省人工智能学会、海南省人工智能学会、广西人工智能学会、广西人工智能协会、福建省人工智能科教学会、湖南省人工智能学会、湖南省人工智能协会、四川省人工智能学会、山东省人工智能协会、福建省人工智能协会、安徽省人工智能协会、贵州省青少年人工智能教育协会、深圳市物联网产业协会、深圳市南山区数字经济产业协会、深圳市宝安区无人系统产业协会、成都市人工智能产业协会、大连市人工智能产业协会、珠海市新一代信息技术与人工智能协会、深圳龙岗区科技创新促进会
粤ICP备05006090号 版权所有©AGIC 深圳市物联传媒有限公司

官方媒体链接:深圳市人工智能产业协会深圳市物联网产业协会物联网世界网