20+个小而精美的python实战案例（附源码和数据）-六虎

大众号：尤而小屋
作者：Peter
编辑：Peter

大家好，我是Peter~

最近小编仔细整理了20+个根据python的实战事例，首要包括：数据剖析、可视化、机器学习/深度学习、时序猜测等，事例的首要特点：

供给源码：都是根据jupyter notebook，附带必定的注释，运行即可
数据齐全：大部分事例都有供给数据，部分事例运用内置数据集

数据统计剖析

根据python和第三方库进行数据处理和剖析，首要运用pandas、plotly、matplotlib等库，详细事例：

电子产品（手机）销售剖析：

（1）不同内存下的销量(代码片段)

nei_cun = color_size["Number_GB"].value_counts().reset_index()
nei_cun.columns = ["Number_of_GB","Count"]  # 重命名
nei_cun["Number_of_GB"] = nei_cun["Number_of_GB"].apply(lambda x: str(x) + "GB")
fig = px.pie(nei_cun,
             values="Count",
             names="Number_of_GB")
fig.show()

（2）不同闪存Ram下的价格散布（代码片段）

fig = px.box(df, y="Sale Price",color="Ram")
fig.update_layout(height=600, width=800, showlegend=False)
fig.update_layout(
    title={ "text":'不同<b>闪存</b>下的价格散布', 
            "y":0.96,  
            "x":0.5,  
            "xanchor":"center",  
            "yanchor":"top"  
          },
    xaxis_tickfont_size=12,   
    yaxis=dict(
        title='Distribution',  
        titlefont_size=16,  
        tickfont_size=12,  
    ),
    legend=dict(
        x=0,  
        y=1,
        bgcolor='rgba(255, 255, 255, 0)',  
        bordercolor='rgba(2, 255, 255, 0)'   
    )
)
fig.show()

7万条餐饮数据剖析

fig = px.bar(df2_top3,x="行政区",y="店肆数量",color="类别",text="店肆数量")
fig.update_layout(title="不同行政区下不同类其他店肆数量比照")
fig.show()

不同店肆下的点评数量比照：

4个目标的联系：口味、环境、服务和人均消费

根据python完成RFM模型（用户画像）

RFM模型是客户联系管理（CRM）中的一种重要剖析模型，用于衡量客户价值和客户创利才能。该模型通过以下三个目标来评估客户的价值和发展潜力：

近期购买行为（R）：指的是客户最近一次购买的时刻间隔。这个目标能够反映客户的活泼程度和购买意向，从而判别客户的质量和潜在价值。
购买的整体频率（F）：指的是客户在必定时刻内购买产品的次数。这个目标能够反映客户对品牌的忠诚度和消费习气，从而判别客户的潜力和价值。
花了多少钱（M）：指的是客户在必定时刻内购买产品的总金额。这个目标能够反映客户的消费才能和对品牌的认可度，从而判别客户的价值和潜力。

计算R、F、M三个目标值：

data['Recency'] = (datetime.now().date() - data['PurchaseDate'].dt.date).dt.days
frequency_data = data.groupby('CustomerID')['OrderID'].count().reset_index()
# 重命名
frequency_data.rename(columns={'OrderID': 'Frequency'}, inplace=True)
monetary_data = data.groupby('CustomerID')['TransactionAmount'].sum().reset_index()
monetary_data.rename(columns={'TransactionAmount': 'MonetaryValue'}, inplace=True)

可视化

可视化首要是讲解了matplotlib的3D图和统计相关图形的制作和plotly_express的入门：

(1) matplotlib的3D图形制作

plt.style.use('fivethirtyeight')
fig = plt.figure(figsize=(8,6))
ax = fig.gca(projection='3d')
z = np.linspace(0, 20, 1000)
x = np.sin(z)
y = np.cos(z)
surf=ax.plot3D(x,y,z)
z = 15 * np.random.random(200)
x = np.sin(z) + 0.1 * np.random.randn(200)
y = np.cos(z) + 0.1 * np.random.randn(200)
ax.scatter3D(x, y, z, c=z, cmap='Greens')
plt.show()

plt.style.use('fivethirtyeight')
fig = plt.figure(figsize=(14,8))
ax = plt.axes(projection='3d')
ax.plot_surface(x, 
                y,
                z, 
                rstride=1,
                cstride=1, 
                cmap='viridis',
                edgecolor='none')
ax.set_title('surface')
# ax.set(xticklabels=[],  # 躲藏刻度
#        yticklabels=[],
#        zticklabels=[])
plt.show()

(2) 统计图形制作

制作箱型图：

np.random.seed(10)
D = np.random.normal((3, 5, 4), (1.25, 1.00, 1.25), (100, 3))
fig, ax = plt.subplots(2, 2, figsize=(9,6), constrained_layout=True)
ax[0,0].boxplot(D, positions=[1, 2, 3])
ax[0,0].set_title('positions=[1, 2, 3]')
ax[0,1].boxplot(D, positions=[1, 2, 3], notch=True)  # 凹槽显现
ax[0,1].set_title('notch=True')
ax[1,0].boxplot(D, positions=[1, 2, 3], sym='+')  # 设置标记符号
ax[1,0].set_title("sym='+'")
ax[1,1].boxplot(D, positions=[1, 2, 3], 
                patch_artist=True,
                showmeans=False, 
                showfliers=False,
                medianprops={"color": "white", "linewidth": 0.5},
                boxprops={"facecolor": "C0", "edgecolor": "white", "linewidth": 0.5},
                whiskerprops={"color": "C0", "linewidth": 1.5},
                capprops={"color": "C0", "linewidth": 1.5})
ax[1,1].set_title("patch_artist=True")
# 设置每个子图的x-y轴的刻度规模
for i in np.arange(2):
    for j in np.arange(2):
        ax[i,j].set(xlim=(0, 4), xticks=[1,2,3],
                    ylim=(0, 8), yticks=np.arange(0, 9))
plt.show()

制作栅格图：

np.random.seed(1)
x = [2, 4, 6]
D = np.random.gamma(4, size=(3, 50))
# plt.style.use('fivethirtyeight')
fig, ax = plt.subplots(2, 2, figsize=(9,6), constrained_layout=True)
# 默许栅格图-水平方向
ax[0,0].eventplot(D)
ax[0,0].set_title('default')
# 垂直方向
ax[0,1].eventplot(D, 
                  orientation='vertical', 
                  lineoffsets=[1,2,3])
ax[0,1].set_title("orientation='vertical', lineoffsets=[1,2,3]")
ax[1,0].eventplot(D, 
                  orientation='vertical',
                  lineoffsets=[1,2,3],
                  linelengths=0.5) # 线条长度
ax[1,0].set_title('linelengths=0.5')
ax[1,1].eventplot(D, 
                  orientation='vertical',
                  lineoffsets=[1,2,3],
                  linelengths=0.5,
                 colors='orange')
ax[1,1].set_title("colors='orange'")
plt.show()

(3) plotly_express入门运用plotly_express怎么快速制作散点图、散点矩阵图、气泡图、箱型图、小提琴图、经验累积散布图、旭日图等

机器学习

根据机器学习的Titanic生存猜测

目标变量剖析：

根据KNN算法的iris数据集分类

特征散布情况：

pd.plotting.scatter_matrix(X_train,
                           c=y_train, 
                           figsize=(15, 15),
                           marker='o', 
                           hist_kwds={'bins': 20}, 
                           s=60,
                           alpha=.8
                          )
plt.show()

混杂矩阵：

from sklearn.metrics import classification_report,f1_score,accuracy_score,confusion_matrix
sns.heatmap(confusion_matrix(y_pred, y_test), annot=True)
plt.show()

对新数据猜测：

x_new = np.array([[5, 2.9, 1, 0.2]])
prediction = knn.predict(x_new)

根据随机森林算法的员工流失猜测

不同教育背景下的人群比照：

fig = go.Figure(data=[go.Pie(
    labels=attrition_by['EducationField'],
    values=attrition_by['Count'],
    hole=0.4,
    marker=dict(colors=['#3CAEA3', '#F6D55C']),
    textposition='inside'
)])
fig.update_layout(title='Attrition by Educational Field', 
                  font=dict(size=12), 
                  legend=dict(
                      orientation="h",
                      yanchor="bottom",
                      y=1.02, 
                      xanchor="right",
                      x=1
))
fig.show()

年纪和月收入联系：

类型编码：

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df['Attrition'] = le.fit_transform(df['Attrition'])
df['BusinessTravel'] = le.fit_transform(df['BusinessTravel'])
df['Department'] = le.fit_transform(df['Department'])
df['EducationField'] = le.fit_transform(df['EducationField'])
df['Gender'] = le.fit_transform(df['Gender'])
df['JobRole'] = le.fit_transform(df['JobRole'])
df['MaritalStatus'] = le.fit_transform(df['MaritalStatus'])
df['Over18'] = le.fit_transform(df['Over18'])
df['OverTime'] = le.fit_transform(df['OverTime'])

根据LSTM的股价猜测

LSTM网络模型搭建：

from keras.models import Sequential
from keras.layers import Dense, LSTM
model = Sequential()
# 输入层
model.add(LSTM(128, return_sequences=True, input_shape= (xtrain.shape[1], 1)))
# 躲藏层
model.add(LSTM(64, return_sequences=False))
model.add(Dense(25))
# 输出层
model.add(Dense(1))
# 模型概览
model.summary()

交叉验证完成：

k = 5
number_val = len(xtrain) // k  # 验证数据集的巨细
number_epochs = 20
all_mae_scores = []
all_loss_scores = []
for i in range(k):
    # 只取i到i+1部分作为验证集
    vali_X = xtrain[i * number_val: (i+1) * number_val]
    vali_y = ytrain[i * number_val: (i+1) * number_val]
    # 练习集
    part_X_train = np.concatenate([xtrain[:i * number_val],
                                  xtrain[(i+1) * number_val:]],
                                  axis=0
                                 ) 
    part_y_train = np.concatenate([ytrain[:i * number_val],
                                  ytrain[(i+1) * number_val:]],
                                  axis=0
                                 )
    print("pxt: \n",part_X_train[:3])
    print("pyt: \n",part_y_train[:3])
    # 模型练习
    history = model.fit(part_X_train,
                        part_y_train,
                        epochs=number_epochs,
                        # 传入验证集的数据
                        validation_data=(vali_X, vali_y),
                        batch_size=300,
                        verbose=0  # 0-静默形式 1-日志形式
                       )
    mae_history = history.history["mae"]
    loss_history = history.history["loss"]
    all_mae_scores.append(mae_history)
    all_loss_scores.append(loss_history)

时序猜测

根据AMIRA的销量猜测

自相关性图：

偏自相关性：

猜测未来10天

p,d,q = 5,1,2
model = sm.tsa.statespace.SARIMAX(df['Revenue'],
                                order=(p, d, q),
                                seasonal_order=(p, d, q, 12))
model = model.fit()
model.summary()
ten_predictions = model.predict(len(df), len(df) + 10)  # 猜测10天

根据prophet的气候猜测

特征间的联系：

猜测作用：

其他事例

python的6种完成99乘法表

供给2种：

for i in range(1, 10):
    for j in range(1, i+1):  # 例如3*3、4*4的情况，有必要确保j能取到i值，所以i+1；range函数本身是不包括尾部数据
        print(f'{j}x{i}={i*j} ', end="")  # end默许是换行；需要改成空格
    print("\n")  # 末尾主动换空行

for i in range(1, 10):       # 外层循环
    j = 1      # 内层循环初始值
    while j <= i:      # 内层循环条件：从1开始循环
        print("{}x{}={}".format(i,j,(i*j)), end=' ')  # 输出格式
        j += 1  # j每循环一次加1，进入下次，直到j<=i的条件不满足，再进入下个i的循环中
    print("\n")

i = 1  # i初始值
while i <= 9:  # 循环停止条件
    j = 1  # j初始值
    while j <= i:    # j的巨细由i来控制
        print(f'{i}x{j}={i*j} ', end='')
        j += 1   # j每循环一次都+1，直到j<=i不再满足，跳出这个while循环 
    i += 1  # 跳出上面的while循环后i+1，只要i<9就换行进入下一轮的循环；不然完毕整个循环
    print('\n')

python完成简易计算器（GUI界面）

供给部分代码：

import tkinter as tk
root = tk.Tk()  
root.title("Standard Calculator")  
root.resizable(0, 0)  
e = tk.Entry(root,
             width=35,
             bg='#f0ffff',
             fg='black',
             borderwidth=5,
             justify='right',
             font='Calibri 15')
e.grid(row=0, column=0, columnspan=3, padx=12, pady=12)
# 点击按钮
def buttonClick(num): 
    temp = e.get(
    )  
    e.delete(0, tk.END)  
    e.insert(0, temp + num)  
# 铲除按钮
def buttonClear():  
    e.delete(0, tk.END)
def buttonGet(oper):  
    global num1, math  
    num1 = e.get()  
    math = oper  
    e.insert(tk.END, math)
    try:
        num1 = float(num1)  
    except ValueError:  
        buttonClear()

更多详细内容，欢迎咨询小编~

20+个小而精美的python实战案例（附源码和数据）