SQL 查询优化:EXPLAIN 命令的妙用

当数据量达到百万级时,一条慢查询足以拖垮整个服务。学会使用 EXPLAIN 来分析 SQL 执行计划是必备技能。 主要关注 type 列,如果是 ALL 表示全表扫描,需要优化索引。

May 17, 2024

使用 Pandas 进行数据清洗实战

在数据分析的工作中,80% 的时间都在做数据清洗。今天记录一下使用 Pandas 处理缺失值和异常值的常用技巧。 处理缺失值 dropna():直接丢弃含有缺失值的行。 fillna():用均值、中位数或特定值填充。 数据透视表 Pandas 的 pivot_table 类似于 Excel 的数据透视表,非常强大。 python import pandas as pd df = pd.read_csv(‘data.csv’) table = pd.pivot_table(df, values=‘sales’, index=‘region’, columns=‘year’, aggfunc=‘sum’) print(table)

May 12, 2024