chatgpt 如何使用用户的数据集 php – 如何处理用于分析的大型数据集以及不同数量的列？

默认分类2年前 (2023)发布 admin

1,564 0 0

ChatGPT国内版

我正在为移动应用程序构建分析系统,并且在决定如何存储和处理大量数据时遇到了一些困难.

每行代表一个“视图”(如网页)并存储一些固定属性,如用户代理和日期.另外,每个视图可以具有不同数量的额外属性,这些属性与所执行的动作或内容标识符有关.

我查看了 ,它可以很好地处理不同数量的属性,但是不支持GROUP BY,并且在行时似乎表现不佳.生成包含30个数据点的月度图表将需要查询每个数据集的每一天.

MySQL更好地处理COUNT和GROUP修饰符,但是附加属性需要存储在链接表和JOIN中以检索属性与给定值匹配的视图,这不是非常快. 5.1的分区功能可能有助于加快速度.

我从上述系统的大量阅读和分析查询中收集到的是,最终所有数据都需要聚合并存储在表中,以便快速生成报告.

chatgpt 如何使用用户的数据集 php – 如何处理用于分析的大型数据集以及不同数量的列？

我是否错过了我研究中显而易见的任何内容,是否有比使用MysqL更好的方法？它不适合作业,但我找不到任何能够同时进行GROUP / COUNT查询和灵活的表结构的任务.

解决方法:

保持在MysqL中：如果写入量有限/读取更常见,并且数据相对简单(即：您可以预测可能的字符),您可以尝试在主表中使用text / blob列,使用逗号分隔值或键/值对更新,并在连接表上使用AFTER / 触发器.您将实际数据保存在单独的表中,因此搜索MAX的/特定“额外”属性仍然可以相对较快地完成,但是检索一个“视图”的完整数据集将是主表中的单行,您可以使用您正在使用的脚本/应用程序拆分为单独的值,从而减轻数据库本身的压力.

这样做的缺点是连接表中更新/插入成本的大幅增加：每次数据更改都需要查询记录的所有相关数据,并在第二次插入“普通”表中,类似于

UPDATE join_table
JOIN main_table
ON main_table.id = join_table.main_id
SET main_table.cache  = GROUP_CONCAT(CONCAT(join_table.key,'=',join_table.value) SEParaTOR ';')
WHERE join_table.main_id = 'foo' GROUP BY main_table.id`).

但是,随着分析数据的发展,它通常会有所不同,所以可能不是每个更新都必须触发缓存中的更新,只需每天使用昨天数据填充缓存的就可以了.

# 默认分类 # 存储 # 属性 # 应用 # 数据 # 视图

© 版权声明

文章版权归作者所有，未经允许请勿转载。

广告也精彩

相关文章

如何使用chatgpt 读取pdf LangChain+ChatGPT三分钟实现基于pdf等文档问答应用

admin

2,055 0

ai谈恋爱软件我的生活，AI做主？

admin

1,547 0

chatgpt对人工智能行业的影响【热点关注】ChatGPT现象级走红，哪些行业“慌”了？

admin

4,039 0

国内付费chatgpt官网分享一个国内可用的 ChatGPT 站点

admin

5,031 0

ai量尺工具建兴也造了把EDSFF规格的“尺子”，用QLC时最大容量可达80TB

admin

1,543 0

chatgpt掀人工智能应用热潮 ChatGPT“火”到两会人工智能前景如何？

admin

57 0

暂无评论

暂无评论...

323AI导航网（323ai.com）—— 精选全球实用AIGC工具箱。 AI人工智能爱好者使用学习必备导航网站，收录了国内外5000+优质AI实用工具网址，一个专业、全面、实用的AIGC工具与AI资讯导航网站，我们聚焦于最新的AI文本、AI绘画、AI视频、ChatGPT、Stable-Diffusion、Midjourney等AI项目，帮助用户发现最前沿的AIGC项目，探索人工智能的无限可能。

友链申请免责声明广告合作关于我们

Copyright © 2025 323AI导航网陕ICP备2023007327号-3