骆明
擅长领域：数据分析与挖掘、网络爬虫、Python网页开发、大数据Hadoop生态、人工智能、机器学习、自然语言处理、图像处理、深度学习等等
邮箱：736704198@qq.com
个人博客：http://minglog.hzbmmc.com

擅长领域：

对数据分析与挖掘、人工智能、自然语言处理、计算机视觉等技术及Python、R、Matlab等编程语言应用纯熟。能够熟练运用Tensorflow、Pytorch、keras等深度学习框架来进行深度神经网络模型的搭建、训练及模型的优化。
曾在校期间多次参加过数学建模竞赛和数据挖掘挑战赛并取得以下奖项，第八届泰迪杯数据挖掘挑战赛全国特等奖、第七届泰迪杯数据挖掘挑战赛全国一等奖、2018年美国大学生数学建模竞赛国际二等奖（Honorable Mention)、全国大学生数学建模竞赛湖北省一等奖、湖北省第十二届挑战杯三等奖。
熟练掌握Python数据科学的各个框架，如Numpy、Pandas、Matplotlib、scikit-learn、Tensorflow2、Keras、PyTorch等；
第九届泰迪杯数据挖掘挑战赛评阅专家，第十三届华中杯数学建模挑战赛评阅专家。
第十届泰迪杯，计算机视觉、自然语言处理赛题赛前讲解专家。
具备比较系统的统计学和数据挖掘理论知识，对常用的数据挖掘模型及算法理解透彻。具有丰富的项目经历，包括web网络爬虫、自然语言处理（情感分析、文本分类、LDA主题分析、热点问题挖掘、文本相似度分析等等）、计算机视觉（图像分类、图像语义分割、实例分割、目标检测、缺陷检测等等）。

项目经历：

2017年1月-12月，新浪微博网络舆情分析

项目简介：随着互联网时代的到来，新媒体产业发展迅速，移动互联网成为网络舆情传播的主要媒介。而网络通信的日渐发达也给网络社会安全带来了很大的隐患。本项目通过对在线社交网络中的舆情传播问题进行研究，并对传播数据的进行特征分析，揭示舆情传播的内在规律。

项目技术路线：本项目首先利用Python网络爬虫技术对新浪微博“某个热点事件”的转发数据和评论数据进行了爬取。然后，针对评论数据进行预处理，并利用情感得分算法算出每条评论的情感得分，绘制出情感得分随时间变化的情感极性图，从理论上论证了舆情被证实前后，用户评论的情感极性逐渐由积极变为消极，论证了舆情传播的两大特点——高效性和时效性。

项目职责：网络爬虫的编写、自然语言处理模型的搭建、项目组成员的分工、人员协调。

2018年3月-6月，“基于stacking集成模型的直肠癌淋巴结转移智能诊断”

项目简介：直肠癌是指从齿状线至直肠乙状结肠交界处之间的恶性肿瘤，易向肠外浸润并发生淋巴结及远处转移，直肠癌患者是否有淋巴结转移对治疗方案的决策以及病人预后有重要的影响，因此对是否有淋巴结转移的准确判断是直肠癌治疗的重要步骤，本项目将基于影像组学技术对此问题进行研究，设计出有效的算法通过对直肠癌 CT 影像特征的判断来对淋巴结转移情况进行评估，提高影像学对淋巴结转移判断的准确性。
项目技术路线：本项目采用Python中的SimpleITK模块对dcm文件进行读取，然后进行相关预处理、图像增强，利用Unet神经网络模型完成了对直肠癌肿瘤部分的分割，然后采用PyRadiomics模块对分割后的肿瘤区域进行影像组学的特征提取，共提取到了833个影像组学特征，然后将组内相关系数较小的特征剔除，得到稳定特征，稳定特征占原始特征的比例大约是55.70%（464/833）。然后采用PCA对特征进行降维，取出累计贡献率在85%以上的特征进行预测模型的建立。预测模型的选取的是stacking集成模型，利用支持向量机、Boosting、逻辑回归和朴素贝叶斯这四种较为常见分类算法来生成异质的基学习器，随机森林作为元学习器，完成直肠癌淋巴结转移的预测。
项目职责：项目基础路线的设计、人员分配、项目进度的把控、代码的调整优化。

2018年9月-11月，“协同消费亦或数据泡沫？——基于携程网在线评论的网络数据挖掘分析”

项目简介：随着“P2P”，“B2B”等新概念的提出，国内旅游业焕发出新的生机，“线上旅游”成为旅游业发展的创新方向，线上旅游使得游客的食宿均可以通过网上预订，改变了以往游客“用餐难”、“住宿难”的局面，新型经济模式同时衍生出了很多旅行第三方APP,比如途牛，携程，飞猪旅行等（阿里旅行）。第三方平台的加入使得消费者的权益得到了一定程度的保障。但这种模式带给用户的体验也并不完全是积极的，线上旅游业务同时也在遭遇“信任危机”，出现了酒店评分与用户实际体验严重不符的情况，大量不合格评论，虚假评论充斥着这些APP,使得最终评分严重“失真”
项目技术路线：为了验证这一现象是否存在，本项目以携程网部分线上酒店的用户评论为研究样本，运用python软件的相应算法进行关键词提取和词频分析统计，并绘制相应的词云图，意图挖掘出用户评论所表达的深层情感（情感分析），最终通过建立回归模型对酒店综合得分的拟合情况作进一步分析，旨在得出酒店APP中用户的实际体验和综合评分是否存在一定程度的背离。
项目职责：网络爬虫的编写与酒店评论数据的爬取、数据探索及预处理、情感分析算法的设计

2019年3月-6月，“基于深度学习的绝缘子缺陷检测研究”

项目简介：绝缘子是高压输电线路中的关键装置，主要用于支撑和固定载流导体，防止电流回地，长期裸露在室外，容易发生故障，是电力巡线中的检测对象。基于此，本文以电力巡线监测中的航拍图像为研究对象，利用深度学习算法实现了航拍图像中绝缘子串分割，并对分割出的绝缘子串进行“自爆”检测。

项目技术路线：项目研究流程主要分为绝缘子图像分割、连通区域检测、绝缘子提取、绝缘子缺陷检测四个部分。由于航拍图像像素过大且图片的数据集过小，本项目首先采用滑动窗口对航拍图像进行了切分，然后对切分后的子图像进行的数据增强，以扩充数据集。然后对U-Segnet模型进行了改进，利用改进后的模型对绝缘子图片进行训练，利用得到的模型初步提取出绝缘子的掩膜图像；接着采用连通区域面积滤波对小连通区域进行剔除，得到过滤后绝缘子的掩膜图像。然后利用掩模图像将原始图像中的绝缘子部分切分出来（剔除背景对检测的影响），利用yolo-v3模型进行检测模型的训练，最终能够有效的识别出绝缘子的自爆位置，模型的IOU值达到了91.17%。

项目职责：技术路线的设计、U-Segnet模型的改进、yolo-v3模型的调试与优化

2020年12月-2021年2月，“基于数据挖掘的上市公司高送转预测”

项目简介：我国金融市场日渐成熟，在大数据和信息化的时代特征下，国内市场的量化产品比重逐渐上升，量化投资的方式能够获得超额收益，量化投资的理念也获得了更多投资者认可，因此越来越多地被使用。量化选股是量化投资的主要内容之一，而多因子模型又是量化选股模型中应用最广泛的一种，经过国内外多年的研究发展，已经成为量化投资中比较成熟的、系统的理论，近年来在我国资本市场有着良好的发挥。风格轮动也是量化选股的重要组成部分，其中风格现象又主要包括成长、价值风格轮动和大盘、小盘风格轮动两种，本文针对大小盘风格轮动进行建模分析。就目前而言，我国的量化选股存在着策略单一、业绩分化等缺点。因此，探寻与挖掘新的量化选股方式，推动量化投资的发展显得尤为重要。
项目技术路线：本项目首先是对原始的数据进行的预处理（删除object类型的特征、重复值处理、缺失值处理、特征构造、特征工程），原始数据主要分为三个文件，基础数据、日数据、年数据，要同时结合三个数据进行模型的训练就需要将三个文件的数据格式进行统一，预处理完后得到了431个特征，然后采用Lasso模型对特征进行的筛选，选出了Lasso评分在前20的特征进行模型的训练，最后使用随机森林模型对下一年公司的高送转情况进行了预测。
项目职责：项目预研、技术路线的设计、模型/算法的调优、人员协调安排

职业认证：

工信部考试中心《高级大数据应用工程师》

授课经历：

2023年4月-7月，武汉学院泰迪杯培训

培训内容：泰迪杯赛题解读、泰迪杯经验分项讲座、Python编程基础、Python数据分析与应用、Python可视化

2023年3月-6月，中南民族大学21级大数据专业实训

培训内容：Python数据分析与应用、Python可视化、Python机器学习实战、Mysql数据库与Redis数据库应用实战、初识分布式网络爬虫、案例：航空公司客户价值分析、案例：丙型肝炎预测分析、案例：市财政收入分析及预测、案例：电商产品评论数据分析

2023年2月，武汉工程大学19级信计专业实训

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、Tensorflow2实战、深度学习原理与项目实战、案例：水色图像处理、案例：基于CNN的人脸识别实战、案例：猫狗大战、案例：基于CNN的花卉识别

2022年11月-2023年1月，中南民族大学21级大数据实训

培训内容：Python编程基础、Python网络爬虫实战、Python可视化、案例：京东商城某手机评论数据采集与分析、案例：B站数据抓取（视频+弹幕）、案例：新浪微博数据抓取与分析、案例：今日头条表情包抓取、案例：豆瓣影评采集与分析

2022年11月-12月，中南民族大学20级大数据实训

培训内容：Python编程基础、Python可视化、Python机器学习实战、案例：航空公司客户价值分析、案例：丙型肝炎预测分析、案例：市财政收入分析及预测、案例：电商产品评论数据分析

2022年10月-11月，华夏理工学院实习实训

2022年9月，武汉理工大学毕业实习

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、Tensorflow2实战、深度学习原理与项目实战、案例：水色图像处理、案例：基于CNN的人脸识别实战、案例：猫狗大战、案例：直肠癌淋巴结转移的智能诊断

2022年8月-9月，湖北师范大学毕业实习

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、案例：丙型肝炎预测分析、案例：市财政收入预测、案例：航空公司客户价值分析、Opencv图像处理基础、案例：水色图像处理、案例：垃圾短信识别、Python网络爬虫实战、案例：百度热搜电影TOP30排行榜、案例：今日头条表情包抓取、案例：B站数据采集

2022年7月，“三峡大学理学院信计、统计、应数、光电专业实训”

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、Tensorflow2实战、深度学习原理与项目实战、案例：水色图像处理、案例：基于CNN的人脸识别实战

2022年7月，“三峡大学理学院信计、统计、应数、光电专业实训”

2022年6月，“湖北工程学院新技术学院大数据专业实训”

培训内容：Python编程基础、Python网络爬虫实战、Python可视化、案例：京东商城某手机评论数据采集与分析、案例：新浪微博数据抓取与分析、案例：今日头条表情包抓取

2022年6月，“湖北工程学院新技术学院软件工程代课老师【软件测试方向】”

培训内容：Python编程基础、黑盒测试、白盒单元测试、基于Selenium的自动化测试

2022年4月-6月，“中南民族大学大数据专业实训”

2022年1月，“华中农业大学理学院研究生实习实训”

培训内容：Python编程基础、Python数据分析与应用、Python机器学习实战、深度学习基础—人工神经网络、案例：贷款违约预测、Tensorflow2实战、Tensorflow2深度神经网络实战、案例：水色图像水质识别、案例：直肠癌淋巴结转移的智能诊断

2022年1月，“全国高校大数据与人工智能师资研修班人工智能实战（计算机视觉方向）”主讲老师

培训内容：Python编程基础、Python数据分析与应用、Python机器学习实战、深度学习基础—人工神经网络、Tensorflow2实战、Tensorflow2深度神经网络实战、案例：水色图像水质识别、案例：基于CNN的人脸识别系统开发实战

2021年9月，“武汉理工大学数学与统计学学院信息与计算科学专业、基地专业毕业实习”

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、案例：市财政收入分析及预测、案例：垃圾短信识别、实战案例：疫情期间网名情绪识别

2021年8月-9月中旬，“中国地质大学（武汉）数学与物理学院应用数学专业毕业实习”

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、案例：市财政收入分析及预测、案例：智慧公交站点选址问题、案例：水色图像处理、实战案例：手写数字识别。

2021年7月，“三峡大学理学院光电专业毕业实习”

2021年7月，“中南民族大学数学与统计学学院认知实习”

培训内容：Python编程基础、Python数据分析与应用、Python可视化、Python机器学习实战、案例：市财政收入分析及预测、案例：垃圾短信识别

2021年6月，“三峡大学理学院信计与数学专业毕业实习”

2021年4月，“中南民族大学泰迪杯赛前培训”

培训内容：第九届泰迪杯赛题分析、Python编程基础、Python数据分析与应用、Python机器学习实战、opencv图像处理基础。

2021年3月-4月，“录制第八届泰迪杯挑战赛赛题讲解（泰迪云课堂课程)”

培训内容：基于数据挖掘的上市公司高送转预测（案例）、电力巡检智能缺陷检测（案例）、“智慧政务”中的文本挖掘应用（案例）。

2021年2月，“武汉学院大数据建模平台师资培训”

培训内容：大数据建模平台的基本使用、利用大数据建模平台实现航空公司客户价值分析案例。

2020年11月-2021年1月，“第七届师资研修班人工智能专题”

培训内容：Python基础、Python数据分析与应用、Python机器学习、Tensorflow2实战、深度神经网络、利用循环神经网络（RNN）对路透社新闻进行分类（案例）、基于深度学习的推荐系统受众性别预测（案例）。

2020年10月-11月，“湖北第二师范学院大数据实训课程”

培训内容：Python基础、Python数据分析与应用、Python机器学习、航空公司客户价值分析（案例）、P2P优惠券的使用预测（案例）。

Ming-Log's Blog

about

擅长领域：

项目经历：

职业认证：

授课经历：