AILab/bbit_ai/app/agent/licenseImageAgent.py

from typing import TypedDict

from langchain_core.messages import HumanMessage
from langgraph.graph import StateGraph, END

from config.llm import llmVision


# -------- 定义状态 --------
class State(TypedDict):
    image_url: str  # 证件照
    type: int  # 证件类别
    content: str  # 最终内容


def analyze_card(state: State, prompt_text: str):
    messages = [
        HumanMessage(
            content=[
                {"type": "text", "text": prompt_text},
                {"type": "image_url", "image_url": {"url": state["image_url"]}},
            ]
        )
    ]
    return llmVision.invoke(messages).content


# -------- 定义节点 --------
def decide_source(state: State, max_retry=3):
    choice = analyze_card(
        state,
        """
        请根据图片内容判断其中的证件类型，并输出对应代号。
        代号说明：
        -1: 并非证件
        0：身份证
        1：银行卡

        只输出代号数字，不要输出任何文字、标点或解释。
        你的输出是：
    """,
    )
    print("图片类型是", choice)
    try:
        choice = int(choice)
        state["type"] = choice
        if choice == -1:
            state["content"] = '{"result": "暂不支持此证件"}'
    except ValueError:
        state["type"] = -1
        state["content"] = '{"result": "暂不支持此证件"}'
    return state


def idcard(state: State):
    state["content"] = analyze_card(
        state,
        """
你是一个 OCR 信息提取专家，请从图片中识别出身份证的全部可见信息，并输出严格的 JSON 格式。

要求：
1. 无论是正面还是反面，都要识别所有字段。
2. 如果某个字段无法辨认，请将值设为 null。
3. 只输出 JSON，不要输出任何解释或多余内容。
4. 严格保持 JSON 格式，键名统一为英文。
5. "side" 字段为身份证方向，填写："人像面" 或 "国徽面"。
6. 对于身份证正面（含地址）的情况，请在提取 "address" 的基础上，将地址进一步拆分为以下字段：
   - "xian": 县、区、市级行政单位，如“宜州区”、“石泉县”
   - "xiang": 乡、镇、街道，如“怀远镇”、“城关镇”
   - "cun": 村或社区名称，如“李家寨村”、“明星村”
   - "zu": 屯或组信息，如“拉瓦屯”、“十五组”。
     若地址中同时出现“组”和“号”，仅保留“组”部分，不要包含“号”；例如：
       “十五组31号” → "zu": "十五组"
       “拉瓦屯62号” → "zu": "拉瓦屯"
     门牌号（如“31号”、“62号”）不需要单独提取，保留在原始 "address" 字段中。
   若某部分在地址中无法明确识别，请将该字段值设为 null。

JSON 示例格式：
{
  "side": "国徽面",
  "name": "持证人姓名",
  "gender": "性别",
  "ethnicity": "民族",
  "id_number": "身份证号",
  "birth_date": "出生日期",
  "address": "住址",
  "xian": "县或区",
  "xiang": "乡或镇",
  "cun": "村或社区",
  "zu": "组或门牌号",
  "issuing_authority": "签发机关",
  "valid_period_start": "有效期开始日期",
  "valid_period_end": "有效期结束日期",
  "notes": "其他可见文字或备注"
}

请确保输出的 JSON 可以被严格解析。
""",
    )
    return state


def bankcard(state: State):
    state["content"] = analyze_card(
        state,
        """
    你是一个 OCR 信息提取专家，请从图片中识别出银行卡上的全部可见信息，并输出严格的 JSON 格式。
    要求：
    1. 识别卡号、发卡行、持卡人、有效期等关键信息。
    2. 如果某个字段无法辨认，请将值设为 null。
    3. 只输出 JSON，不要输出任何解释或附加内容。
    4. 严格保持 JSON 格式，键名统一为英文。

    JSON 示例格式：
    {
      "bank_name": "发卡行名称",
      "card_number": "卡号",
      "card_holder": "持卡人姓名",
      "expiry_date": "有效期",
      "card_type": "卡种类型（如借记卡/信用卡/Visa/MasterCard）",
      "issuer_country": "发卡国家",
      "notes": "其他可见文字或符号"
    }

    请确保输出的 JSON 可以被严格解析。
""",
    )
    return state


# ------------------------------------------------------------------------ 构建有向图 --------
workflow = StateGraph(State)
workflow.add_node("decide", decide_source)
workflow.add_node("idcard", idcard)
workflow.add_node("bankcard", bankcard)
workflow.set_entry_point("decide")
# 条件边：根据 path 决定走向
workflow.add_conditional_edges(
    "decide",
    lambda state: state["type"],
    {
        -1: END,
        0: "idcard",
        1: "bankcard",
    },
)
workflow.add_edge("idcard", END)
workflow.add_edge("bankcard", END)
graph = workflow.compile()

import re


# 执行函数
def get_license_response(image_url: str):
    final_state = graph.invoke(
        {
            "image_url": image_url,
        }
    )
    # 去掉 ```json 和 ``` 包裹
    final_state["content"] = final_state["content"]
    final_state["content"] = re.sub(
        r"^```json\s*|\s*```$", "", final_state["content"].strip()
    )
    print("最终识别内容：", final_state["content"])
    return final_state