我的问题是:综合分析一下2021的大米和化妆品的销售情况?
我发现“大米”的销量涨了200%,而“化妆品”的销量下降了100%。
我能说我的大米质量变好了,而化妆品的质量变差了吗?
当然不能。 原因是: 那年疫情了。。。
TAG产生的逻辑
仅仅依赖数据表中的变化趋势,难以全面洞察和精准决策。
除了表象信息,我们还需深入挖掘更多背后的故事。
过去,我们通过编写一个个SQL查询,生成不同的BI报表(即看板),结合既有知识和主观判断,共同解读数据背后的原因。这种方法融合了客观数据与主观智慧,为我们提供了更全面的视角。
如果我们能将脑海中的这些信息以文本形式存储起来,再结合数据库中的数据,不就能完美融合客观信息与主观信息了吗?
想象一下,将搜索引擎本身视为一个庞大市场信息库,而我们公司内部的各种设备更换、人员调动等记录则可以作为日志数据,形成一个独特的企业内部信息库。
在进行市场分析时,如果我们能让大模型在执行SQL分析的同时,动态调用其他补充信息库,那么输出的结果将不再仅仅是冷冰冰的表格数据,其输出结果将变得更加丰富和立体,不仅包含详尽的数据,还能进行深入的推理和全面的思考,这种多维度的分析结果无疑会带来巨大的价值和影响力。
了解了以上信息之后,让我们来看看TAG一步步的发展历程吧。
Text2SQL
综合分析一下2021年的大米和化妆品的销售情况?
那text2sql之后,可能是这样的:
select product_name, sum(money) from sale where year = '2021' group by product_name.
以上图表仅仅基于数据库中查询到的数据统计,展示了这两个产品的销售额情况。
然而,这样的数据真的能全面反映销售状况吗?
众所周知,那一年正值疫情肆虐。
因此,这份数据或许无法揭示全部真相,它仅仅是一个冰冷且信息量极少的数字展示。
TAG
TAG的全称是: Table-Augmented Generation,可以理解为在表的基础上进行增强,之后在进行输出。
如果我们用搜索引擎作为市场调查数据库。就可以补充当前场景下更多的市场信息,然后可以得到更好的综合分析。
假设我们通过对原问题的分析之后,得到了一个合理的对于市场调查的问题:
原问题: 综合分析一下2021年的大米和化妆品的销售情况?
合理的市场调查问题: 2021对大米的影响
查询的数据中包括了这些数据:
第一阶段1-2月份,受散发疫情影响,春节前国内大米集中备货价格普遍上涨。节后市场仍受到节前氛围支撑,处于高位。2月下旬开始局部性稻米价格开始回落,进入下一阶段。
第二阶段3-9月份新粮集中上市前,市场价格总体呈下滑趋势。主要原因:第一,2021年春节前市场集中备货量大,消化时间长,市场购销低迷。第二,至2021年2月底前,稻米市场价格总体高位,随着米市需求转淡,价格风险逐步增大。第三,大米进口量高位,加之部分低价陈粮有所冲击市场。另外,麦收腾仓、集中备货、市场心态等均对阶段性行情带来一定影响。
第三阶段,新粮上市季,10-12月价格先跌后涨再稳。10月份新稻陆续上市,价格有所回落。11月中上旬大米集中备货,加之多因素收购托底,价格上涨。12月需求转淡,因价格并不高,且农户低价惜售,稻米价格总体以稳为主,局部小幅偏弱。2021年新粮上市突出特点:市场心态理性,价格波动幅度缩小。
这些数据就提供了更多的市场信息,揭示了更丰富的市场动态。
结合这些基础数据(大米和化妆品的销量)与2021年的大米市场信息,LLM能够为您提供一个全面且深入的分析结果。
综合判断
我们的提示语就变成了这样:
这是我们的公司2021年的销量信息:
大米:300w,化妆品:100w
2020年的大米和化妆品信息
大米:100w,化妆品:200w市场信息中关于2021年中大米的影响如下:
第一阶段1-2月份,受散发疫情影响,春节前国内大米集中备货价格普遍上涨。节后市场仍受到节前氛围支撑,处于高位。2月下旬开始局部性稻米价格开始回落,进入下一阶段。
第二阶段3-9月份新粮集中上市前,市场价格总体呈下滑趋势。主要原因:第一,2021年春节前市场集中备货量大,消化时间长,市场购销低迷。第二,至2021年2月底前,稻米市场价格总体高位,随着米市需求转淡,价格风险逐步增大。第三,大米进口量高位,加之部分低价陈粮有所冲击市场。另外,麦收腾仓、集中备货、市场心态等均对阶段性行情带来一定影响。
第三阶段,新粮上市季,10-12月价格先跌后涨再稳。10月份新稻陆续上市,价格有所回落。11月中上旬大米集中备货,加之多因素收购托底,价格上涨。12月需求转淡,因价格并不高,且农户低价惜售,稻米价格总体以稳为主,局部小幅偏弱。2021年新粮上市突出特点:市场心态理性,价格波动幅度缩小。
综合分析一下,回答一下我的问题:综合分析一下2021的大米和化妆品的销售情况?
这样以来就可以输出更综合考虑之后的判断信息了。
写在最后
让我们再次聚焦于模型的核心:
在给定输入的情况下,输出会是什么?
要使输出更加精准且丰富,一个关键前提是输入必须足够全面。
如果你渴望获得更全面的答案,输入的多样性和信息的完整性至关重要。
(文章都属于原创,我花费大量时间,希望你在AI的实施过程中少走弯路,可以将AI工程化。 如果对你有帮助,帮我点赞、转发。这将是我最大的动力。万分感谢!!)