天天看点

2021数学建模国赛E题思路 中药材的鉴别 第一版思路 思路开源

原创开源思路文档下载链接

链接:https://pan.baidu.com/s/13aSy2-hlkLa7Ps8wknYY1Q 

提取码:gap4

这里有百种算法出处整理,本题算法可从上面找取:

给裸赛的家人们整理了百种算法出处

2021数学建模国赛E题思路 中药材的鉴别 第一版思路 思路开源

https://mp.weixin.qq.com/s/OhWRCeep885MuyhMhvdiOw

这里先给大家普及下红外光谱仪,药品会一次性加入到红外光谱机里,然后内部会水循环,水循环速度是不变的,不同药材随水的方向移动是不同的,毕竟这涉及到颗粒大小,重量,扩散性等因素影响,并且红外辐射会激发分子振动从而产生红外吸收光谱,不同药物分子情况不同,因此局造成了每次采集数据时,检测到的吸光度不同,其实简单理解就是说红外光谱仪能根据分子的在水中的扩散性、化学稳定性、颗粒分子大小等等对药物检测出不同的波信号,可能会有波信号相近的,这是仪器避免不了的误差问题

这道题千万别拿着就开始先降维数据了,图1和图3中的药材大概经历了一个水循环周期,图2大概经历了4个水循环周期,所以说这道题直接用降维算法处理是不严谨的,这道题可以直接用全量数据带入机器学习算法中训练然后识别类别,也可以通过时间序列中EMA、AMA做下曲线平滑会对训练效果有一点提升

第一问为无监督式分类,可以这么来做,以某个k聚类算法作为目标函数,即分好类别后计算下样本与所在聚类中心的差值之和,k和聚类中心数作为自变量,外循环配一个优化算法进行单目标寻优

第二问有监督分类,使用机器学习方法比如说dbn、随机森林、Xgboost、支持向量机都可以用用,带入已分类数据进去训练,然后带为止类别进去识别出是哪种类别;这个问也可以通过聚类算法和相关性/距离等方式去做,例如,先对已知类别数据,针对每类算一个聚类中心,然后用聚类中心的数据向量对未知类别的样本数据做相关性/计算距离,哪一个相关信号/距离近就是哪一个类别;当然也可以用协同过滤推荐算法去做

第三问,两种红外有一定差别,一般的近红外要好点,其实这个问就是先用近红外数据识别,然后用中红外数据去矫正,反过来也可以,看你们使用的算法的效果来定,这个问有两种方式去解决,一个是将近红外和中红外检测的数据进行点乘得到一个新的红外数据,直接带入算法中训练然后识别,第二种就是分别对两个红外数据集中已知类别样本进行训练,得出两种结果,然后将这两种结合和输出类别重新构建一个训练集,带入算法再次训练并输出类别

第四问不用考虑同一产地同一类别作为一个类型,一般都是先检测药物类别,在针对每个类别去识别产地,算法同上,也可以每个问换一下算法都行

继续阅读