首页 理论教育 科研实力的比拼在技术层面展开

科研实力的比拼在技术层面展开

时间:2023-06-15 理论教育 版权反馈
【摘要】:技术层比拼的是各个公司的科研能力,核心是技术人才的竞争。与O2O等主要依赖商业模式创新的领域不同,在人工智能技术层创业,对公司的技术背景和科研能力要求极高,创始人也多为海内外知名高校相关技术研发领域的学术人才,创业门槛相对较高。目前国家标准尚未出台,旷视科技的金融领域产品还在测试和试点推广阶段。应用产品开发将是未来旷视科技盈利的重要方向。

科研实力的比拼在技术层面展开

技术层是技术的竞争,是科学家的战场。

技术层比拼的是各个公司的科研能力,核心是技术人才的竞争。通常而言,技术层也是巨头较有优势的领域,首先,巨头们能够为科学家开出天价年薪,吸引其加盟。其次,巨头有实力为科研人员提供良好的科研环境和基础设施条件,以及长期的资金投入,为科学研究保驾护航。如谷歌仅邀请颀顿团队加入的花费就超过6亿美元。目前“深度学习四大天王”中的颀顿、YannLe Cun、吴恩达(已离职)分别加盟谷歌、Facebook和百度,只有Yoshua bengio还在蒙特利尔大学坚持学术研究。“四大天王”的加盟也让谷歌、百度在深度学习、视觉识别等人工智能技术领域取得了领先地位。

人工智能的发展核心是技术,与基础资源层的竞争不尽相同,虽然巨头们在该领域依然占据一定优势,不少怀有梦想的技术天才也选择独立创业,开疆扩土。在国外有Palantir,国内有视觉识别领域的旷视科技、SenseTime及语音识别领域的云知声这些独角兽企业,科大讯飞更是成功登陆创业板,成为全球第一家人工智能领域的上市公司。这些企业背后都有极强的技术背景支撑:科大讯飞作为中科院孵化项目,董事长刘庆峰本身是中科大信号信息处理专业博士;旷视科技的主要创始团队均来自清华大学;SenseTime的主要团队师从全球视觉识别领域权威专家汤晓鸥教授,云知声创始人梁家恩同样来自中科大,曾就职于中科院自动化研究所。与O2O等主要依赖商业模式创新的领域不同,在人工智能技术层创业,对公司的技术背景和科研能力要求极高,创始人也多为海内外知名高校相关技术研发领域的学术人才,创业门槛相对较高。

1.旷视科技:让机器“看”懂世界

旷视科技是典型的从技术层切入,拓展到应用层创新发展的创业企业,基于已有人工智能核心算法和应用场景设计,对应用技术进行研发和优化,再基于公司积累的机器视觉技术开发应用产品和服务,拓展多领域多场景商业应用。

(1)产业布局:技术层切入,应用层变现,实现数据循环

人工智能由技术驱动发展,技术能力是企业发展的核心基础。

旷视科技主要创始团队均来自清华大学计算机科学实验班,依托技术背景,从人脸识别技术研发入手创业,早期代表产品为Face++人脸识别技术开发平台。

旷视科技的发展规划为技术平台—商业应用—数据循环。第一阶段发展的重心是提升技术能力,投资、引进多位科技人员进行机器视觉、深度学习等核心算法的研究和在应用领域的研发。

在经历研发—应用—研发多轮循环,技术相对成熟之后,旷视科技利用机器视觉技术开发了人脸识别摄像头、智慧商超解决方案等应用产品,并搭建FaceID云端平台,提供人脸识别技术服务。旷视科技目前正处于规划发展的第二阶段,即通过商业应用检验技术能力、实现变现和数据积累,最终目标是实现数据的循环应用,扩大技术可服务领域,创造更大的技术应用空间,而最终的智能产品及服务都会以数据服务的形式体现。

(2)商业化实例:技术开放云平台+金融安防为主的应用产品/解决方案

旷视科技第一个商业化的方向是开发PaaS平台,通过云服务的形式向开发者提供服务。人脸识别的技术门槛较高,开发者在开发产品的过程中,使用旷视科技的API或SDK,可以快速拥有人脸识别或者身份验证等功能,节约开发成本,缩短开发时间。小米金融加入人脸身份验证功能,及美图秀秀解决“一键美颜”中对人脸、五官位置的识别问题时,均采用旷视科技的技术服务。除了带来收入,技术云服务也是旷视科技早期积累数据、提升算法性能和提升品牌知名度的重要方式。

旷视科技商业化的第二个方向是基于技术,针对应用场景开发硬件产品和解决方案。

人脸识别技术的主要应用包括人脸身份识别和验证,以及自身具有身份识别条件且可关联到个体身份的物品的识别和验证,如汽车。通过机器识别人的身份主要在金融、安防场景下应用,因此旷视科技首先针对这两个应用场景开发产品。在安防领域能够实现客户身份的识别,自动监控人员、车辆的进出,并对可疑人员进行追踪和报警,在机场、住宅小区、写字楼等场所应用。重点是能够提升安防效率,比如提升对危险人物排查的效率;快速收集、记录和调用相关数据,降低安保人员工作量,减少了企业及相关部门的管理成本。在金融领域,核心方向是使用人脸识别验证身份,替代传统的密码验证,提升账户资金的安全性,还可实现远程开户。目前国家标准尚未出台,旷视科技的金融领域产品还在测试和试点推广阶段。

应用产品开发将是未来旷视科技盈利的重要方向。

(3)未来发展方向:技术从人脸识别到万物识别,应用向更多领域扩展

旷视科技未来发展依旧遵循技术研究和产品开发并行的路线,扩大技术和产品的应用领域。在商业应用中积累数据,并通过数据量的增加提升核心算法和应用技术,继而扩展商业应用场景,实现以数据循环为基础、以技术为核心、以应用进行商业变现的人工智能生态链。在技术方面,将扩大机器识别的领域,从人脸识别到图片识别再到万物识别。当视觉识别技术能够识别万物的时候,将成为机器的“眼睛”,作为机器获取外界信息、数据的重要入口。基于技术的进步,旷视科技将开发功能更丰富的产品,也从金融、安防向交通医疗等更多领域发展。(www.xing528.com)

2.科大讯飞:让世界聆听我们的声音

科大讯飞是一家以技术研发为核心的公司,以语音合成、语音识别、自然语言处理等语音相关的人工智能技术为核心,构建技术开发平台,开发人工智能应用。

(1)产业布局:研发技术,构建应用

科大讯飞同样是拥有技术背景的创业团队,选择从技术层切入,再向应用层发展。

科大讯飞的主要创始团队来自中科大,同时中科大也是讯飞的主要股东之一,凭借与中科大的合作,科大讯飞选择从技术层切入进行创业。技术角度而言,早期科大讯飞以语音识别、语音合成等语音相关技术研发为核心,后期逐渐往图像识别、深度学习等更全面的人工智能领域扩张,向认知智能层面突破。在技术研究的基础上,讯飞向应用层延伸,基于语音识别等技术,讯飞开发软件服务、硬件产品和行业解决方案等类型的应用。

(2)商业化方向:语音类技术开放平台/硬件,开发应用产品

科大讯飞第一个商业化方向,同样是通过技术开放云服务的形式,向开发者提供语音识别、身份验证等技术服务。不同的是,讯飞还向客户提供有语音识别技术的语音麦克风阵列等元器件解决方案,能够通过这些元器件的特性提升语音识别的准确率,为客户开发硬件产品提供服务。

基于技术开发产品是讯飞的第二个商业化方向。主要有基于语音识别的产品、智能教育产品以及行业解决方案三个方向。

基于语音识别的产品也可分为三类:

1)移动端应用,包括将语音转化为文字的语音输入法,录音转入软件等软件服务。

2)改变智能硬件交互方式的系统,例如使用语音操控的叮咚智能音箱等硬件产品,以及在汽车、智能电视中使用的语音操作系统等。

3)基于语音识别开发的行业级产品,例如电信行业的智能电话客服,公共安全领域的声纹识别产品等。该类型的产品主要使用语音识别技术和语义分析技术,解决机器识别语音的问题,让机器“听懂”语音或者命令,并完成任务,改变机器的交互方式,操作更加便利。

讯飞第三个商业化方向是围绕教育行业提供产品服务,包括口语考试系统、阅卷系统,以及针对学生批改作业的产品等。科大讯飞首先使用文字识别和语音识别技术,识别学生的答案,再将答案与后台答案库进行对比、批改。在批改的过程中,科大讯飞还使用了自然语言处理、语言分析等技术,使得简答题、作文题的批改也能通过机器完成。另外,在批改的同时还能够对学生的知识体系进行分析,发现学生的知识盲点,给出进一步的学习意见。讯飞在教育领域使用人工智能技术,将老师从繁杂的作业、考卷批改中解脱出来,同时通过移动教学产品也向学生提供个性化教育服务。

最后,讯飞还针对行业需求,开发整体智能化的解决方案,包括智能交通解决方案、智慧城市解决方案等。以智能交通解决方案为例,使用视频监控、GPS监控等终端采集数据,结合城市道路设施等数据,通过利用人工智能技术开发的交通运输管理平台和智能决策分析平台进行分析预测,最终通过门户网站、交通信息平台、交通诱导平台完成交通调整,实现智能交通管理,缓解城市交通拥堵问题。

(3)未来发展方向:长期的技术突破和短期的产品开发

长期技术研究依然是科大讯飞的核心,重点分为感知智能和认知智能两个方面。感知智能方面一是按照神经网络、大数据、数学算法等人工智能的发展路线,重点解决语音交互、自然语言理解、图像识别的问题;二是基于脑科学研究的“讯飞大脑计划”,以期实现从感知智能向认知智能的发展。在技术研究的基础上,进行周期较短的产品开发,基于语音交互的产品以及智能教育领域产品是科大讯飞重点发展的方向。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈