【langchain学习】使用PandasDataFrameOutputParser对DataFrame进行数据处理
创始人
2024-11-14 13:06:03

介绍如何使用Langchain结合ChatGLM对Pandas DataFrame进行数据处理。以下是具体步骤和代码示例:

  1. 导入所需库

    from config.chatglm_config import llm_glm4 import pprint from typing import Any, Dict import pandas as pd from langchain.output_parsers import PandasDataFrameOutputParser from langchain.prompts import PromptTemplate 
  2. 格式化解析器输出函数

    def format_parser_output(parser_output: Dict[str, Any]) -> None:     for key in parser_output.keys():         parser_output[key] = parser_output[key].to_dict()     return pprint.PrettyPrinter(width=4, compact=True).pprint(parser_output) 
  3. 定义Pandas DataFrame

    df = pd.DataFrame(     {         "num_legs": [2, 4, 8, 0],         "num_wings": [2, 0, 0, 0],         "num_specimen_seen": [10, 2, 1, 8],     } ) 
  4. 设置解析器和提示模板

    parser = PandasDataFrameOutputParser(dataframe=df) df_query = "检索 num_wings 列。" prompt = PromptTemplate(     template="回答用户查询。\n{format_instructions}\n{query}\n",     input_variables=["query"],     partial_variables={"format_instructions": parser.get_format_instructions()}, ) 
  5. 执行链操作

    chain = prompt | llm_glm4 | parser parser_output = chain.invoke({"query": df_query}) format_parser_output(parser_output) 
  6. 得到结果

{'num_wings': {0: 2,                1: 0,                2: 0,                3: 0}}  Process finished with exit code 0 

相关内容

热门资讯

裸辞做“一人公司”,我后悔了 去年这个时候,一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品,一个让任...
南京建成国内首个Pre-6G试... 4月21日,2026全球6G技术与产业生态大会在南京开幕。全息互动技术展台前,一名远在北京的工作人员...
超梵求职受邀参加“2025抖音... 超梵求职受邀参加“2025抖音巨量引擎成人教育行业生态大会”,探讨分享优质内容传播,服务万千学员。 ...
摩托罗拉Razr 2026(R... IT之家 4 月 22 日消息,摩托罗拉宣布新一代 Razr 折叠手机将于 4 月 29 日在美国发...
库克卸任,特纳斯领航:苹果新纪... 苹果首席执行官蒂姆·库克将卸任,硬件工程主管约翰·特纳斯将接任,苹果公司今天宣布此事。 库克将在夏季...