完备的 AI 学习路线,最详细的资源整理!
收藏
分享
脑图
完备的 AI 学习路线,最详细的资源整理!
以下文章来源于Datawhale ,作者AIUnion
基础知识
1 数学
数学是学不完的,也没有几个人能像博士一样扎实地学好数学基础,入门人工智能领域,其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程,这三门课程是本科必修的。这里整理了一个简易的数学入门文章:
1) 机器学习的数学基础.docx
中文版,对高等数学、线性代数、概率论与数理统计三门课的公式做了总结。
2) 斯坦福大学机器学习的数学基础.pdf
原版英文材料,非常全面,建议英语好的同学直接学习这个材料。
提取码: hktx
2 统计学
入门教材:深入浅出统计学
进阶教材:商务与经济统计
3 编程
入门人工智能领域,首推Python这门编程语言。
1) Python安装:
Python安装包,我推荐下载Anaconda,Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换以及各种第三方包安装问题。
推荐选Anaconda (python 3.7版本)
安装教程:
2) python入门的资料推荐
作者李金,这个是jupyter notebook文件,把python的主要语法演示了一次,值得推荐。
提取码: 2bzh
3)补充
数据分析/挖掘
1 数据分析的基础书籍
《利用python进行数据分析》
这本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy,Pandas、Matplotlib以及IPython等)高效地解决各式各样的数据分析问题。如果把代码都运行一次,基本上就能解决数据分析的大部分问题了。
机器学习
公开课   吴恩达 CS229
公开课   林轩田《机器学习基石》
配套教材
公开课   林轩田《机器学习技法》
书籍《统计学习方法》
书籍  《Scikit-Learn 与 TensorFlow 机器学习实用指南》
实战  Kaggle 比赛
工具  Scikit-Learn 官方文档
深度学习
公开课   吴恩达《Deep Learning》
课程视频
公开课   Fast.ai《程序员深度学习实战》
视频地址
课程笔记
公开课   CS230 Deep Learning
书籍   《深度学习》
书籍   《深度学习 500 问》
TensorFlow 官方文档
PyTorch官方文档
强化学习
Reinforcement Learning-David Silver
视频地址
课程资料
李宏毅《深度强化学习》
视频地址
课程资料
前沿Paper
1  Arxiv
2  Papers with Code
Papers with Code(Browse state-of-the-art)
Papers with Code(Sorted by stars)
3  Deep Learning Papers 阅读路线
这份深度学习论文阅读路线分为三大块
1 Deep Learning History and Basics
2 Deep Learning Method
3 Applications
4  Deep Learning Object Detection
5  知名会议
会议
计算机视觉
自然语言处理
知名期刊
其它
机器人方面,有 CoRL(学习)、ICAPS(规划,包括但不限于机器人)、ICRA、IROS、RSS;对于更理论性的研究,有 AISTATS、COLT、KDD。
理论应用
自然语言处理
1  NLP是什么
自然语言处理(NLP,Natural Language Processing)是研究计算机处理人类语言的一门技术,目的是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。NLP包含句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、问答系统和对话系统等领域。
2  课程推荐
CS224n 斯坦福深度自然语言处理课
自然语言处理 - Dan Jurafsky 和 Chris Manning
3  书籍推荐
Python自然语言处理
自然语言处理综论
统计自然语言处理基础
4  博客推荐
5  项目推荐
6  开源NLP工具包
英文NLP相关
7  相关论文
计算机视觉
1  计算机视觉的应用
无人驾驶
无人安防
人脸识别
车辆车牌识别
以图搜图
VR/AR
3D重构
无人机
医学图像分析
其他
2  课程推荐
3  书籍推荐
1.入门学习
《Computer Vision:Models, Learning and Inference》
2.经典权威的参考资料
《Computer Vision:Algorithms and Applications》
3.理论实践
《OpenCV3编程入门》
推荐系统
推荐课程
这个系列由4门子课程和1门毕业项目课程组成,包括推荐系统导论,最近邻协同过滤,推荐系统评价,矩阵分解和高级技术等。
书籍推荐
《推荐系统实践》(项亮 著)
《推荐系统》(Dietmar Jannach等 著,蒋凡 译)
《用户网络行为画像》(牛温佳等 著)
《Recommender Systems Handbook》(Paul B·Kantor等 著)
算法库
LibRec
LibMF
SurPRISE
Neural Collaborative Filtering
Crab
常用数据集
推荐论文
推荐项目
风控模型(评分卡模型)
推荐书籍
《信用风险评分卡研究——基于SAS的开发与实施》
评分卡模型建模过程
样本选取
确定训练样本、测试样本的观察窗(特征的时间跨度)与表现窗(标签的时间跨度),且样本的标签定义是什么?一般情况下风险评分卡的标签都是考虑客户某一段时间内的延滞情况。
特征准备
原始特征、衍生变量
数据清洗
根据业务需求对缺失值或异常值等进行处理
特征筛选
根据特征的IV值(特征对模型的贡献度)、PSI(特征的稳定性)来进行特征筛选,IV值越大越好(但是一个特征的IV值超过一定阈值可能要考虑是否用到未来数据),PSI越小越好(一般建模时取特征的PSI小于等于0.01)
对特征进行WOE转换
即对特征进行分箱操作,注意在进行WOE转换时要注重特征的可解释性
建立模型
在建立模型过程中可根据模型和变量的统计量判断模型中包含和不包含每个变量时的模型质量来进行变量的二次筛选。
评分指标
评分卡模型一般关注的指标是KS值(衡量的是好坏样本累计分部之间的差值)、模型的PSI(即模型整体的稳定性)、AUC值等。
知识图谱
1  知识图谱是什么
知识图谱是一种结构化数据的处理方法,它涉及知识的提取、表示、存储、检索等一系列技术。从渊源上讲,它是知识表示与推理、数据库、信息检索、自然语言处理等多种技术发展的融合。
2  推荐资料
3  主要内容
知识提取
构建kg首先需要解决的是数据,知识提取是要解决结构化数据生成的问题。我们可以用自然语言处理的方法,也可以利用规则。
使用规则
正则表达式
推荐资料进阶
中文分词和词性标注
推荐资料入门
推荐资料进阶
命名实体识别
推荐资料
使用深度学习
使用自然语言处理的方法,一般是给定schema,从非结构化数据中抽取特定领域的三元组(spo),如最近百度举办的比赛就是使用DL模型进行信息抽取。
序列标注
推荐资料
seq2seq
推荐资料
 知识表示
JSON和YAML
知识存储
需要熟悉常见的图数据库
a.知识链接的方式:字符串、外键、URI
b.PostgreSQL及其JSON扩展
c.图数据库 Neo4j和OrientDB
d.RDF数据库Stardog
知识检索
4  相关术语及技术路线
4.1  Protege构建本体系列
4.2 开发语言
python或java
4.3 图数据库技术
4.4 可视化技术
4.5 分词技术
5 项目实战
贡献平台
由知名开源平台,AI技术平台以及领域专家:ApacheCN,Datawhale,AI有道和黄海广博士联合整理贡献:
1.ApacheCN:片刻,李翔宇,飞龙,王翔
2.Datawhale:范晶晶,马晶敏,李碧涵,李福,光城,居居,康兵兵,郑家豪
3.AI有道:红色石头
4.黄海广博士
平台介绍
Datawhale
一个专注于AI领域的开源组织,上海交通大学国家级孵化项目,目前有7个独立团队,聚集了一群有开源精神和探索精神的团队成员,汇聚了来自各个高校和企业的优秀学习者,致力于构建纯粹的学习圈子和优质的开源项目,提供的组队学习涵盖了数据分析,数据挖掘,机器学习,深度学习,编程等16个内容领域。
AI有道
一个专注于 AI 领域的技术公众号。公众号主要涉及人工智能领域 Python、ML 、CV、NLP 等前沿知识、干货笔记和优质资源!我们致力于为广大人工智能爱好者提供优质的 AI 资源和切实可行的 AI 学习路线。
黄博(机器学习初学者)
机器学习课程在国内还不够普及,大部分初学者还是很迷茫,走了很多弯路,黄海广博士希望能尽自己的微薄之力,为机器学习初学者提供一个学习交流的平台。
一个致力于提供优质开源项目的开源组织,致力于AI文档翻译,Kaggle比赛交流、LeetCode算法刷题、大数据交流等项目。我们希望做出广大 AI 爱好者真正需要的东西,打造真正有价值的长尾作品。

评论

0 / 100
查看更多
我叫搞事情
2019-11-01
2105
硬禾服务号
关注最新动态
0512-67862536
info@eetree.cn
江苏省苏州市苏州工业园区新平街388号腾飞创新园A2幢815室
苏州硬禾信息科技有限公司
Copyright © 2023 苏州硬禾信息科技有限公司 All Rights Reserved 苏ICP备19040198号