Python数据科学_16_案例:垃圾短信识别【简单自然语言处理】 发表于 2022-09-20 更新于 2023-03-09 分类于 技术 本文字数: 5.1k 阅读时长 ≈ 5 分钟 1import pandas as pd 数据读取1data = pd.read_csv('message80W1.csv', header=None, index_col=0) 1data.columns = ['类别', '文本内容'] 1data.head() 阅读全文 »
Python数据科学_15_案例:水色图像处理【简单计算机视觉】 发表于 2022-09-19 更新于 2023-03-09 分类于 技术 本文字数: 3.2k 阅读时长 ≈ 3 分钟 读取图片数据12import osimport cv2 12path = 'water_images'imgname_list = os.listdir(path) # 获取path文件夹下所有的文件名称 阅读全文 »
Python数据科学_14_Opencv图像处理基础 发表于 2022-09-18 更新于 2023-03-09 分类于 技术 本文字数: 1.4k 阅读时长 ≈ 1 分钟 使用numpy生成一张图片12import numpy as npimport matplotlib.pyplot as plt 1img1 = np.zeros((100, 100, 3)) 12plt.imshow(img1)plt.show() 阅读全文 »
Python数据科学_13_案例:航空公司客户价值分析【聚类案例】 发表于 2022-09-17 更新于 2023-03-09 分类于 技术 本文字数: 6.6k 阅读时长 ≈ 6 分钟 背景和目标行业内竞争民航的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格、服务间的竞争逐渐转向对客户的竞争。 行业外竞争随着高铁、动车等铁路运输的兴建,航空公司受到巨大冲击。 目标 借助航空公司客户数据,对客户进行分类。 对不同的客户类别进行特征分析,比较不同类别客户的客户价值。 对不同价值的客户类别提供个性化服务,制定相应的营销策略。 阅读全文 »
Python数据科学_12_案例:市财政收入预测【回归案例】 发表于 2022-09-16 更新于 2023-03-09 分类于 技术 本文字数: 7k 阅读时长 ≈ 6 分钟 目标: 求出现有的13个特征中,哪几个特征对y(地方财政收入)影响最大 求出2014年和2015年这两年的财政收入 阅读全文 »
Python数据科学_11_案例:丙型肝炎预测分析【分类案例】 发表于 2022-09-15 更新于 2022-09-28 分类于 技术 本文字数: 3k 阅读时长 ≈ 3 分钟 利用所给数据集使用合适的分类算法,对标签列进行分类。 1import pandas as pd 阅读全文 »
Python数据科学_10_神经网络基础 发表于 2022-09-14 更新于 2023-03-09 分类于 技术 本文字数: 27k 阅读时长 ≈ 25 分钟 手动推导人工神经网络读取数据12import pandas as pdimport numpy as np 12train_data = pd.read_csv('BPdata_tr.txt').valuestest_data = pd.read_csv('BPdata_te.txt').values 12print('训练数据尺寸:', train_data.shape)print('测试数据尺寸:', test_data.shape) 训练数据尺寸: (500, 3) 测试数据尺寸: (100, 3) 阅读全文 »
Python数据科学_9_决策树算法基础 发表于 2022-09-13 更新于 2022-09-28 分类于 技术 本文字数: 2.2k 阅读时长 ≈ 2 分钟 泰坦尼克号生还者预测读取数据集1import pandas as pd 1data = pd.read_csv('titanic_data.csv', index_col='PassengerId') 阅读全文 »
Python数据科学_8_聚类分析基础 发表于 2022-09-12 更新于 2022-09-28 分类于 技术 本文字数: 19k 阅读时长 ≈ 17 分钟 手动编写KMeans聚类算法算法步骤: 随机选取K个样本作为类中心; 计算各样本与各类中心的距离; 将各样本归于最近的类中心点; 求各类的样本的均值,作为新的类中心; 判定:若类中心不再发生变动或达到迭代次数,算法结束,否则回到第2步。 阅读全文 »
Python数据科学_7_回归分析基础 发表于 2022-09-11 更新于 2023-03-09 分类于 技术 本文字数: 5.2k 阅读时长 ≈ 5 分钟 任务1求出利用最小二乘法通过(1,1) (2,3) (3,3)三点拟合出的直线 # b = 0.1 a = 1.1 $y=wx + b$ 创建数据1import numpy as np 123# sklearn中要求自变量(特征)的维度是二维x = np.array([[1], [2], [3]])y = np.array([1, 3, 3]) 阅读全文 »