如何用Python高效统计并排序大型商品数据集？（高效.如何用.排序.统计.商品...）

如何用python高效统计并排序大型商品数据集？

利用Python高效处理和排序大型商品数据集

本文演示如何将一个包含商品信息的列表高效地转换为另一个包含商品统计信息并按特定规则排序的列表。原始数据包含商品标题、颜色、尺码和数量，目标是统计相同标题、颜色和尺码的商品数量，并计算每个标题下所有商品的总数量，最终结果按总数量降序排列。

示例原始数据：

data = [
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '黑色', 'M', 1),
    ('裤子', '白色', 'S', 1),
]

目标输出格式：

result = [
    ('连衣裙', '白色', 'S', 2, 3),
    ('连衣裙', '黑色', 'M', 1, 3),
    ('裤子', '白色', 'S', 1, 1),
]

其中，最后一个数字代表该标题下所有商品的总数量。为了高效处理大型数据集，我们将使用Python的collections.Counter对象进行计数。

以下代码实现了这一功能：

from collections import Counter

data = [
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '黑色', 'M', 1),
    ('裤子', '白色', 'S', 1),
]

# 使用Counter统计每个(标题, 颜色, 尺码)组合的数量
item_counts = Counter(tuple(item[:-1]) for item in data)

# 使用Counter统计每个标题的总数量
title_totals = Counter(item[0] for item in data)

# 创建结果列表，包含标题、颜色、尺码、数量和标题总数量
result = [
    (*item, count, title_totals[item[0]])
    for item, count in item_counts.items()
]

# 按标题总数量降序排序，然后按标题、颜色、尺码升序排序
result.sort(key=lambda x: (-x[4], x[0], x[1], x[2]))

print(result)

这段代码首先利用Counter高效地统计每个商品组合和每个标题的出现次数。然后，它构造一个新的列表，包含所有必要的信息，并根据总数量进行排序。这种方法充分利用了Counter的效率，能够轻松处理包含数千条甚至更多记录的大型数据集。

以上就是如何用Python高效统计并排序大型商品数据集？的详细内容，更多请关注知识资源分享宝库其它相关文章！

如何用Python高效统计并排序大型商品数据集？（高效.如何用.排序.统计.商品...）

最近发表

标签列表

如何用Python高效统计并排序大型商品数据集？（高效.如何用.排序.统计.商品...）

相关阅读

Python中如何优雅地访问动态命名变量？（变量.命名.优雅.动态.访问...）

Python subprocess模块执行wmic datafile命令失败，如何解决？（如何解决.模块.命令.失败.执行...）

为什么在Chrome中访问某东移动站点时，滑块验证总是无法通过？（滑块.验证.站点.访问.Chrome...）

微信公众号新闻列表抓包失败怎么办？（公众.失败.列表.新闻...）

如何解决Django项目部署到宝塔面板后样式丢失的问题？（宝塔.如何解决.样式.部署.丢失...）

如何使用Pytest只运行单个测试文件？（如何使用.运行.文件.测试.Pytest...）

最近发表

标签列表