1. 数据是核心
这一轮的人工智能实际上是数据智能,深度学习算法通过输入数据训练算法,学习数据中隐藏的模式,最终实现分类和回归的任务。从而可以解决一大类以前对人类简单,但对机器很难的问题,例如:
- 人脸识别
- 车牌识别,交通统计
- 物体分类
人工智能系统的三大要素:
- 数据
- 计算资源(服务器,GPU)
- 算法工程师
计算资源只要花钱就能买到,算法工程师更多是工匠,除非顶级的算法工程师,否则差别不会特别大。因此人才和计算资源都是通用的,难以差异化。
数据,尤其是与行业结合的数据,其他人获取不到,才可能成为真正稀缺的资源。
如李开复所说,AI产业已经从发明时代进入了实干的年代,重点在于取得行业数据,解决细分领域的问题。
2. 训练才能成长
有监督的学习,通过训练提升性能。
反馈的方式:
- 客观结果
下围棋的输赢 - 专家结果评价
3. 方向的选择
判断模式相对复杂,但结果很明确的领域
- 商品推荐和广告服务
电商和社交网站 - 投资
金融机构 - 法律文档
法律行业,专利检查、审核 - 报税系统
医疗影像等行业的切入方式:
- 巨头大平台信誉可靠
Google+DeepMind,腾讯 - 专业公司+医院合作
依图+华西医院 - 医疗器械厂商自己做
如鱼跃医疗
细分领域的应用:
- 按大小分拣黄瓜,CV系统
- 分析动物迁徙路线,CV识别
- 风格迁移,CV迁移学习
让机器为自己干活
TODO:
- 熟悉训练深度学习模型的套路
掌握如何成功训练模型的方法论 - 能够评估训练一个业务的资源消耗
需要多少GPU计算资源(费用),耗费多少人力,有哪些风险 - 找到深度学习的应用场景,能对接的业务性质
- 利用起原有的行业资源
4. AI应用的思考
明确目标
做窄应用,限定的场景
弱人工智能,宜窄不宜宽,宜特定不宜宽泛
领域
优势在于数据和行业经验
要回答的问题:
- 领域是否有数据
- 数据是否有壁垒
- 是否能够定义出可以用人工智能解决的问题
- 是否被市场接受
- 大公司是否做同样的事情
- 信任问题
- 挤压问题
最好和行业场景以及传感硬件结合,拿到大公司拿不到的数据。
开发
是否有清晰客观的结果
??
没有理解
运营
算法上的优势很难构成核心优势。
把优势控制在数据+行业经验
了解行业的痛点。
个人思考
利用信息不对称赚钱
用现有的成熟AI方法,对传统行业降维打击。
比训练模型刷百分点更有意义的是,找到更合适通用AI的应用场景,结合新的行业需求。