小米开发者大会三大关键词:相机影像、小爱同学和AIoT

韩璐 4年前 (2020-11-05)

雷军:2021年将扩招5000名工程师,聚焦10大领域。

今天,小米开发者大会正式召开。

大会上,雷军立下工程师扩增5000人新目标,并带来了小爱同学5.0版本等6大最新技术成果,以及一个“重磅发布”。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

“相机影像技术”贯穿全场,伸缩式大光圈镜头创新亮相

在上午的小米开发者大会中,如果问哪个部分最常被提及的话,那或许就是相机影像技术了。

2016年4月,小米在手机业务成立核心器件部,下设相机组;

2018年,“相机组”单独成立一级部门“相机部”。

时至今日,小米相机部的团队已经从122人扩增至850人,另外还有350名AI工程师,并在北京、东京、巴黎等9地设立研发中心,邀请超过40位全球行业泰斗加盟,以打造世界顶级影像表现。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

从目前的成果来看,小米在相机影像技术方面可以说是成功的,诸如在太空拍地球等诸多创新尝试令消费者惊叹。

在之后小米集团副总裁、集团技术委员会主席崔宝秋演讲中,“相机影像能力”也成为重点分享内容:120倍潜望式长焦、128°超广角、长焦微距、一亿像素……

而就在今天下午的演讲部分,小米也不负众望的带来了最新的相机创新技术——伸缩式大光圈镜头。基于这一技术,手机似乎在形态上正趋向于相机。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

依据小米副总裁、手机部总裁曾学忠的介绍,该技术借鉴专业相机,自主开发伸缩相机技术,可在有限的尺寸下,达到更好的光学效果。

具体数据方面,超大光圈进光量提升300%,引入全新防抖技术,画面更稳定,清晰度提升20%。目前该技术已实现了小型化,可做到手机中。

在介绍的最后,曾学忠也表示,在不久的将来,这一技术将会与用户见面。

小爱同学5.0、开放相机三大功能……小米发布6项技术

作为一个智能语音助手,在小米智能生态中,小爱同学作为“入口守护者”的重要性不言而喻。

小米集团副总裁、技术委员会主席崔宝秋在现场表示,小爱同学截至目前累计唤醒次数已达617亿次,可能是中国最活跃的AI语音交互平台;激活小爱同学的设备数达到2.28亿台;小爱同学月活跃用户达到7840万。

而在此次现场,崔宝秋也正式揭开了小爱同学5.0版本的神秘面纱,以及与此相关的产品升级。

· 小爱同学5.0

全场景智能协同:协同唤醒——多设备环境下智能选用最佳方式应答倾听;协同响应——多设备环境下智能调度最优设备响应执行;协同提醒——多设备环境下自动生成个性化设备联动建议;

对话式主动智能;

定制化情感声音:儿童音色泡芙;定制声音终端上线;更地道的粤语;

多模态融合交互:小爱同学音箱端支持手势控制、童脸识别、距离检测;小爱同学手机端支持多模态输入扫描、识物、翻译、扫文档等;

智慧学习好助手:AI课程表——支持1000所高校、拍摄导入、全终端通用;AI翻译——面对面翻译、连续翻译、一句话翻译;K12教辅——精选优质视频网课,教育会员三端共享;知识问答——十万个为什么,世界之最。

据悉,目前使用小米智能设备的用户已超3600万,设置智能互联场景的用户达900万,每天使用智能扫地机器人的家庭超过400万,小米的智能门锁守护了超过200万个家庭的安全。

“小米的技术已经渗透到了人们生活的方方面面,而小爱同学5.0正是大家的智能生活助手。”崔宝秋在现场表示。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

· MiNLP 3.0 &下一代语音识别工具

去年的开发者大会上,小米发布了MiNLP 2.0版本,今年则带来全新的3.0版本,具体的升级主要体现在:

升级至四大功能板块——在基础算法、语义理解上,新增内容理解、舆情分析模块

提升语义解析技术——结合预训练、知识图谱能力,全面提升深层语义解析技术

拓展多模态理解能力——基于文本、语音、图像和视频等多模态特征,对内容精准理解

与此同时,崔宝秋也表示,开源一定是未来的方向。这之后,他对外公布了MiNLP开源计划。

依据计划,小米的第一步是在2020年11月中下旬正式对外开源MiNLP-分词,2021年Q1开放MiNLP-词性标注,2021年Q2开放MiNLP-命名实体识别,2021年Q3对外开放MiNLP-语义相关功能。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

值得注意的是,MiNLP 3.0和开源计划并不是小米在智能语音语义技术方面的全部实力。

崔宝秋在现场说到,“去年Daniel Povey加入了小米,担任小米集团语音首席科学家,他在加入时就说要打造下一代Kaldi。”就在现场,Povey也被邀请上台,介绍了下一代Kaldi的相关情况。

Povey介绍,在下一代Kaldi中,“K2”语音识别库将是最核心的部分,它可以消除过往语音识别算法中的一些代码不匹配问题,并且速度更快、通用性更强,可以用来建模多种语音识别算法。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

· 移动端深度学习框架MACE 1.0&物联网软件平台Xiaomi Vela

MACE全称为Mobile AI Compute Engine,是一个移动端的深度学习框架,第一次出现在小米发布会是在2018年,直到2019年才推出0.12版本。彼时,MACE针对移动芯片特性进行了大量优化,在小米手机上的人像模式、场景识别功能中已广泛应用。

今天的开发者大会上,MACE升级到了1.0版本——MACE Micro,这是小米单独为小规模IoT产品打造的引擎。依据崔宝秋的介绍,MACE Micro的代码量低至数百KB,传感器和处理器功耗均小于1毫瓦,成本低至0.1美元,将致力于助力AI全线赋能AIoT产品。

众所周知,AIoT已经成为了小米生态战略的一部分,而除了AI计算引擎,小米也带来了物联网软件平台“Xiaomi Vela”,该平台基于开源的NuttX系统打造而成。

基于过往的成果,以及此次发布的计算引擎和专用平台,就“赋能AIoT”这条道路上,可以看到在走得更远的同时,小米也没有忘记夯实“地基”。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

· 开放相机三大能力

崔宝秋在现场表示,小米有信心让自己的相机团队继续保持世界第一,这一自信的背后是小米对于技术的执着投入。当前,小米已经在全球范围内建立了超过200家实验室,目前授权专利数量已经超过16000万,境内专利占比55%。

令人兴奋的是,就在今天的开发者大会上,小米方面宣布面向第三方APP开放相机三大能力,包括长焦、超广角、微距、多摄同开的硬件能力,以及美颜、超级夜景、超级防抖等软件能力。

同时,小米也将基于影像处理能力为IoT设备赋能,让IoT设备在影像处理方面实现“质变”。

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

雷军:小米模式是“互联网+制造”,明年再招5000名工程师

就在今年8月份的十周年发布会上,雷军就成表示,小米的模式的已经从互联网发展为现在的“互联网+制造”。

在今天的开发者大会上,雷军再次强调小米的“互联网+制造”模式,致力于帮助工厂实现智能化、自动化、无人化升级。与此同时,雷军也提到了第二期智能工厂的规划,“规模要大10倍,争取做到一个人没有。”

紧接着,雷军也表示,小米的重点是突破硬核科技,而人才是创新之源。

依据计划,小米原本今年要扩招3000人,不过由于疫情的影响拖慢了扩增的步伐,最终只招纳了2800多人。

至于明年的扩招计划,雷军也在现场立下目标——扩招5000名工程师,并公布了人员招募的10个重点领域:

小米开发者大会三大关键词:相机影像、小爱同学和AIoT

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到