Mudux Blog

我究竟拿时间换了什么

logistic回归算法理论详解

logistic regression(LR)回归从名字上看是回归算法,但其实是一个分类算法。是机器学习中最常用的算法之一。LR回归用来估计事物发生的概率,如用户购买商品的概率,广告被点击的概率。 1. 概率预测问题  在线性判别模型如PLA下,我们直接预测测试样本是pass/fail, positive/negative,etc。假设现在想要预测事件发生的概率而不仅仅是发生或者不...

knn分类算法详解与代码实现

1. KNN理论介绍  K近邻(k-nearest neighbors, KNN)是一种基本的机器学习方法,KNN既可以做分类,也可以做回归。 KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。KNN做分类预测时,一般选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类别。而KNN做回归时,一般选择平均法,即最近的K个样本的输出的平均值作为回归预测...

dbscan聚类算法详解与代码实现

1. DBSCAN理论介绍  DBSCAN(Density-Based Spatial Clustering of Applicaions with Noise,具有噪声的基于密度的聚类方法)是一种很典型的聚类算法,和KMeans,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。 1.1 密度聚类原理  DBSCAN是一种基于密度的聚类...

kmeans聚类算法详解与代码实现

kmeans

最近开始复习机器学习知识,这里总结下聚类里面的Kmeans算法。 1. 理论介绍 1.1 KMeans理论介绍  K-平均算法(英文:k-means clustering)源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是:把n个点(可以是样本的一次观察或一个实例)划分到k个聚类中,使得每个点都属于离他最近的均值(此即聚类中心)对应的聚...

My Second Kaggle Competition Top 1%

kaggle competition

ASHRAE-Great Energy Predictor III 写在前面:第二次参加kaggle比赛,比赛名次为10/3614。这次还是一个数据挖掘的比赛,相比于上个欺诈检测的比赛学到了东西就少了些,而且也没那么有趣,但还是有所收获。感谢给力的队友Clancy Lee。 1. 比赛介绍 1.1 比赛背景 ASHRAE协会组织的关于能源消耗预测的比赛。 Founded in 18...

2019年12月项目2总结

 最近这个月做了一个小项目,功能是用来做效能评估,即装备状态评估。界面如下: 主要包括四个模块: 数据预处理;功能包括数据标注,标注算法有3种,DBSCAN,KMeans和层次聚类法,聚类后PCA降到2维显示。为了第二个模块属性约简,这里要加数据离散化模块。 属性约简;应用粗糙集理论进行属性约简。 综合评估;其实就是分类算法,实现了层析分析法,SVM和BP神经网络。层析分析法...

qt mysql 操作

 在实验室项目过程中有需求自动存储数据到数据库,查了下mysql数据库提供了API供程序调用,这里总结下在C++程序中常用的api操作。 c++ mysql操作 mysqlc.h文件: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 #include <winsock.h> #includ...

qt自动生成word报告

 最近做项目过程中需要自动生成word报告,Microsoft的word支持通过COM组件调用。因为项目是用qt来做,所以使用Qt提供的ActiveQt框架中的QAxContainer模块下的QAxobject、QAxWidget类调用COM组件。  这里支持插入文字、表格、图片等。在调用之前需要先创建word模板文件,按照书签名来确定插入文字表格图片到相应位置。 注意应该在proje...

2019年终总结

新的一年开始了,是时候写2019年年终总结了。 两篇文章  投了两篇文章,一篇中文EI期刊已中,一篇EI会议已投,这个应该是稳中的,顺利达到毕业要求。 两个比赛  参加了两个kaggle比赛。  第一个是IEEE-CIS Fraud Detection,是关于信用卡交易欺诈检测的问题,最终排名是148/6381,Top 3%,银牌。  第二个是ASHRAE - Great Energy Pr...

初学QT踩过的坑

最近因项目需要,要做c++ UI界面,毫无疑问的选用qt,这里记录一下踩过的坑。 1. build directory 打开项目编译时,老是报错: Could not create directory "E:\Error in " Util.asciify("build-untitled-Desktop_Qt_5_6_2_MSVC2015_64bit-Debug")": TypeError:...