人工智能技术是什么
概念
研究开发用于模拟 延伸 和 扩展人的智慧理论 方法 技术及应用系统的一门新的技术科学,最初定义为制造智能机器的科学与工程。最终目的是让机器像人一样思考,拥有智能,是一门交叉学科

AI、机器学习、深度学习的关系
- 机器学习:研究计算机
模拟或实现人类的学习行为,从而获取新的知识和技能,并且重组已有知识结构,改善自身性能,是人工智能核心研究领域之一
- 深度学习:源于
人工神经网络的研究,多层感知器就是一种深度学习结构。深度学习是机器学习领域中的新领域,模仿人脑机制来解释数据,如图像、声音、文本
深度学习的本质是神经网络
flowchart LR
深度学习 --> |深度神经网络
深度学习 --> |卷积神经网络
深度学习 --> |循环神经网络

智能机器的分类
flowchart LR
智能机器 -->|像人一样思考| 弱人工智能
智能机器 -->|像人一样行动| 弱人工智能
智能机器 -->|理性思考| 强人工智能
智能机器 -->|理性行动| 强人工智能
目前处于弱人工智能阶段,弱人工智能发展到强人工智能的瓶颈在于脑科学,目前尚不能实现理性思考
AI产业生态
通过互联网、传感器、物联网获取大量数据,经过大数据开发,存储到数据库中
高能芯片通过云计算的形式以算力展示
数据和算力能使用算法融合,融合后从计算机视觉、语音处理、自然语言处理、规划决策、大数据分析数据挖掘等技术方向
配合具体场景应用,应用到金融、医疗、安防、娱乐、教育、零售、农业等

人工智能发展历史
诞生于1965年美国达特茅斯会议,同年,定为人工智能元年
三大主义
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。回顾人工智能的发展历史,我们可以将他们分为人工智能三大主义
==符号主义==旨在用数学和物理学中的逻辑符号来表达思维的形成,通过大量的如果 - 就(if-then)规则定义,产生像人一样的智能,这是一个自上而下的过程,包括老师系统、知识工程等

==连接主义==主张智能来自神经元之间的连接,它让计算机模拟人类大脑中的神经网络及其连接机制,这是一个自下而上的过程,包括人工神经网络等

==行为主义==指的是基于感知行为的控制系统,使每个基本单元实现自我优化和适应,这也是一个自下而上的过程,典型的代表有进化算法 多智能体等,行为主义多注重结果,过程可解释性弱

1956-1976 概念提出,迎来繁荣期
1976-1982 算法局限,机器翻译项目失败,迎来低谷期
1982-1987 第五代计算机、算法更新、多层网络概念,迎来繁荣期
1987-1997 符号主义完全舍弃,基于符号主义的模型被反对,陷入瓶颈,迎来低谷期
1997-2010 深蓝机器人诞生,人工智能战胜人类,人工智能复苏
2010- 大数据时代,2014小娜诞生,2016 AlphaGo战胜围棋冠军 人工智能爆发式发展

发展阶段
目前人工智能发展阶段仍处于初级阶段
|
表现 |
示例 |
价值 |
| ==计算智能== |
能存会算:像人类一样会计算、传递信息 |
分布式计算、神经网络 |
帮助人类存储和处理海量数据,感知智能的基础承载 |
| ==感知智能== |
能听会看:开始能看懂能听懂,做出判断并采取简单行动 |
可识别人脸的摄像头、可听懂语音的音箱 |
能帮助人类高效完成看、听相关工作 |
| ==认知智能== |
能理解会思考:开始像人一样能理解、思考、决策 |
完全独立驾驶的无人汽车、自主行动的机器人 |
可以全面辅助或代替人类部分工作 |
人工智能应用技术场景
背景
flowchart LR
AI应用技术 --> 计算机视觉
AI应用技术 --> 语音处理
AI应用技术 --> 自然语言处理
pie showData
title 国内人工智能企业应用技术分布
"语音" : 22
"视觉" : 46
"自然语言处理" : 19
"基础硬件" : 14
pie showData
title 国外人工智能企业应用技术分布
"语音" : 13
"视觉" : 40
"自然语言处理" : 28
"基础硬件" : 20
计算机视觉
AI应用中最成熟的技术
flowchart
计算机视觉 --> 图像分类
计算机视觉 --> 目标检测
计算机视觉 --> 图像分割
计算机视觉 --> 目标跟踪
计算机视觉 --> 文字识别
计算机视觉 --> 人脸识别

语音处理
flowchart
语音处理 --> 语音识别
语音处理 --> 语音合成
语音处理 --> 语音唤醒
语音处理 --> 声纹识别
语音处理 --> 音频事件检测

自然语言处理
flowchart
自然语言处理 --> 机器翻译
自然语言处理 --> 文本挖掘
自然语言处理 --> 情感分析
自然语言处理难度高,技术成熟度低,目前仅依靠大数并行计算的深度学习,难以达到人类的理解层次
展望:从单一智能(Machine Learning)到混合智能(Machine Learnin、DeepLearning、Reinforcement Learning)
以及目前知识图谱的抽取、智能文案的生成、评分分析等
AI+ 智能医疗
利用人工智能技术,让AI学习记录专业知识,记录大量历史病例,利用计算机视觉识别图像,协助医生诊断
==主要应用场景:==
药物挖掘:AI辅助研发个性化药物
健康管理:涉及营养学、身体和精神健康管理
医院管理:目前主要集中在病例结构化服务
辅助医学研究:辅助生物医学研究者进行研究
虚拟助理:语音电子病历、智能导诊、智能问诊、推荐用药
医学影像:实现医学图像识别、标注、影像三维重建
辅助诊疗:问诊机器人
疾病风险预测:通过基因序列预测疾病风险
AI+ 智能安防
容易落地,发展成熟。安防领域的海量图像和视频数据,为AI算法和模型训练提供了良好基础
==主要应用方向:==
警用:识别可疑人员、车辆分析、追踪嫌疑人、检索对比犯罪嫌疑人、重点场所门禁
民用:人脸打卡、潜在危险预警、家庭布防
AI+ 智能家居
基于物联网技术,由硬件、软件、云平台构建形成的家具生态圈,提供个性化生活服务,使生活便捷、舒适、安全
==主要应用:==
语音处理:控制家居终端产品,如空调温度、窗帘开关、照明系统
计算机视觉:家居安防、面部、指纹识别解锁、实时智能摄像头、住宅非法入侵检测
机器学习、深度学习:根据智能音箱和电视的历史记录建立用户画像,进行内容推荐
AI 对全行业的影响
==公共:== 平安城市、智慧交通、灾害预警
==教育:== 因材施教、注意力提升、机器助教
==健康:== 早期预防、协助诊断、精准治疗
==媒体:== 实时翻译、内容摘要、内容审核
==制药:== 缩短周期、精准试验、精准药物
==物流:== 路径规划、货物监视、自动分拣
==金融:== 文档处理、实时防欺、精准推荐
==保险:== 高效鉴定、欺诈预防、产品创新
==零售:== 无人超市、实时库存、精准推荐
==制造:== 品质检测、工业物联、预测维护
==电信:== 客户服务、网络维护、网络优化
==油气:== 精准钻探、远程维护、运营优化
==农业:== 施肥优化、远程作业、高效育种
人工智能现有的问题
算法的偏见
算法的偏见主要源于数据的偏见,利用人工智能算法决策的时候,算法可能根据已有数据学会歧视某个群体
除了源于数据的偏见,不能排除某些公司(人为因素)现有的算法也会存在歧视问题,但是算法和数据不开放,也没有国家和机构对该内容有相应监管措施
隐私问题
现有人工智能算法都是源自数据驱动,需要大量数据训练模型,享受人工智能带来便捷的同时,例如百度、360、腾讯、阿里巴巴等科技公司也在获取大量的用户数据,这些数据也会真实的揭露生活的多个方面(政治、宗教、性取向等)
这些数据不限于记录浏览记录、页面滚动记录,观看的内容、浏览历史等
科技公司可以参照我们的行程记录、消费记录,推断我们在哪、去哪、做了什么、教育程度、消费能力、个人喜好等个人隐私
眼见为「虚」
随着计算机视觉的发展,图像和视频的可信性越来越低,现在可以通过PS、GAN(生成对抗网络)等制作假图像,难以判断真伪
失业的思考
从人类发展进程来看,人类一直寻求高效率的途径,实现自动化的每一步都会改变生活
AI会取代重复性强、创造性低、弱社交的工作
| ==可能被取代的工作== |
==最不可能被取代的工作== |
| 快递员 |
作家 |
| 出租车司机 |
软件工程师 |
| 军人 |
人力资源管理 |
| 会计 |
设计师 |
| 客服 |
活动策划 |
| ...... |
...... |
人工智能的未来
不同领域的尝试:
深度学习、强化学习:感知智能的初级阶段
非监督学习、知识推理:无标签数据的训练

数据-合成数据训练
需求的催生:AI算法需要大量的数据,手工标准耗时耗力,部分危险数据难以获取
隐私保护-联邦学习
日常产生的大量数据可以用来改善AI模型的表现,但会涉及隐私问题
联邦学习由Google提出,联邦学习概念指出,数据依旧保存在个人终端中,由云服务器派发新的算法 随机发放至用户设备中
智能终端算法改进后,基于本地数据对模型进行更新,经过不断迭代,实现大模型的更新
应用展望
无人超市:取货即走,无人收银,取消收银流程
农业:热成像控制土壤含水量,识别虫害定量喷药,基于卫星影像预测天气从而预测农作物安全
医疗:疾病预测,加速药物研制、药物有效性、安全性预测、构建分子模型、筛选生物标志物
脑科学:AI理解与大脑控制,产生记忆信息,读取思维意图