常见的损失函数(loss function)总结
矩阵乘法的本质是什么?
一些感想杂记
在进行线性回归时,为什么最小二乘法是最优方法?
为什么用交叉熵做损失函数
一文搞懂交叉熵在机器学习中的使用,透彻理解交叉熵背后的直觉
softmax详解
机器学习-Label Encoding与One Hot的区别
为什么在回归中使用LS(最小二乘法)代替LAD(最小一乘法)?
机器学习大佬的进阶之路
knn原理解析
学习率(Learning rate)的理解以及如何调整学习率
机器学习:几个参考网站的网站
如何处理分类中的训练数据集不均衡问题
PCA之前为什么要先标准化
一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC
不均衡样本的评价指标
如何处理数据中的「类别不平衡」?
ROC曲线和AUC面积理解
机器学习:多标签分类的Python之旅
多标签,多分类学习
sklearn中多标签及多分类classifier的一些思考
多标签分类问题
多分类及多标签分类算法
多标签(multi-label)数据: 常用的分类器或者分类策略
机器学习常用库 - 速查表
投票分类器
机器学习中的K-Fold交叉验证
深度学习与python
PCA与SVD的实际应用
感知机算法原理解读
K-means 算法
聚类方法对比
流行学习概述
聚类:期望最大化(EM)算法
高斯混合模型解析及应用案例
5种常用的聚类分析方法
高斯混合模型(GMM)
sklearn半监督算法: 标签传播算法LP成就小样本的变异数据
集成学习(Ensemble Learning)
集成学习原理小结
朴素贝叶斯的三个常用模型:高斯、多项式、伯努利
典型相关分析简述
典型关联分析(CCA)原理总结
CCA典型相关分析的基本思想
模型选择的一些基本思想和方法
主成分分析 - 最小平方误差解释
主成分分析 - 最大方差解释
通俗讲解高斯过程回归
支持向量机的直观理解
高斯过程
核函数粗浅的理解
核函数的定义和作用是什么
kernel最通俗易懂的理解
核岭回归
核岭回归与支持向量机回归
线性判别分析
机器学习:总结应用场景
线性判别分析(LDA)(多分类问题)
线性判别分析(LDA)(二分类问题)
LDA线性判别分析原理示例
线性判别分析LDA的数学原理
线性与二次判别分析
感知机
逻辑回归
深入浅出最大似然估计(Maximum Likelihood Estimation)
LARS(最小角回归)
梯度下降法 VS 坐标下降法
优化算法:坐标下降法(Coordinate Descent)
算法地图
最小二乘法和梯度下降法的比较
常见的几种最优化方法
多元线性回归及多重共线性处理
Variance Inflation Factor (VIF) Explained
理解L1和L2正则化
《统计学习方法》总结笔记
关于统计学中的N-1.
Python的矩阵传播机制&矩阵运算
正则化趣味理解
机器学习模型评估混淆矩阵、ROC曲线和AUC以及PR曲线
朴素贝叶斯算法原理小结
k近邻算法总结
如何理解拉格朗日乘子法
零基础学SVM
支持向量机原理篇之手撕线性SVM
k-means聚类
基于PCA的异常点检测
异常点检测方法简述
线性判别分析LDA原理总结
深入理解 L1 、L2 正则
数据挖掘步骤
使用sklearn做单机特征工程
特征工程:特征选择与特征抽取
特征工程:特征选择
精确率与召回率,RoC曲线与PR曲线.png
卡方检验原理及应用
如何通俗理解奇异值
超好理解的PCA 特征选择
归一化、标准化和正则化
CTR预估中GBDT与LR融合方案
GBDT原理及利用GBDT构造新的特征
为什么要用交叉验证
使用sklearn进行交叉验证
交叉验证(Cross Validation)原理小结
随机森林(Random Forest)
对于随机森林的通俗理解
机器学习之数据清洗、特征提取与特征选择
一份详细的LSTM和GRU图解
Gensim Tutorial - A Complete Beginners Guide – Machine Learning Plus
奇异值分解SVD简介及其在推荐系统中的简单应用
BGD,SGD,MBGD对比总结
小批量(Mini-batch Stochatic Gradient Decent)随机梯度下降法
随机(Stochastic Gradient Descent)梯度下降法
深度解读最流行的优化算法:梯度下降
全批量梯度(Batch Gradient Descent)下降法
梯度下降法小结
Gradient Descent 梯度下降法
TF-IDF算法
贝叶斯推断
18种距离和相似度总结
余弦距离、欧氏距离和杰卡德相似性度量的对比分析
文本相似度:Jaccard系数与Jaccard距离
文本相似度:余弦相似度
编辑距离应用:python实现
文本相似度:计算文本间的距离
文本相似度:编辑距离之Jaro-Winkler距离
文本相似度:莱文斯坦距离(编辑距离)
决策树 - 剪枝
决策树 - 构建
决策树(ID3、C4.5、CART)
决策树-基尼系数
Gini指数、Gini系数、Gini不纯是一回事吗?
决策树之C4.5算法
决策树之 ID3 算法
熵与条件熵
条件熵,相对熵
如何理解K-L散度(相对熵)
信息熵的简单认识
信息熵的粗浅理解
数据标准化/归一化normalization
K-近邻(KNN)算法
机器学习——几种距离度量方法比较
逆矩阵(inverse matrix)的概念及其意义
什么是协方差,怎么计算?为什么需要协方差?
回归系数的显著性校验---T值校验
T校验
岭回归、Lasso回归和弹性网络回归的理论及特点
岭回归
回归分析综述
多重共线性
轻松看懂机器学习十大常用算法
如何理解矩阵的秩
最小二乘法
机器学习十大常用算法
矩阵中心化和标准化
线性回归中的哑变量
相关性与离散性