Žingsnis po žingsnio vadovas, kaip sukurti AI naujienų santrauką naudojant „Streamlit“, „Groq“ ir „Tavily“

Turinys

Įvadas

Šiame vadove mes sukursime pažangų AI varomą naujienų agentą, kuris galėtų ieškoti žiniatinklio naujausių naujienų tam tikra tema ir apibendrinti rezultatus. Šis agentas seka struktūrizuotą darbo eigą:

Naršymas: Sukurkite atitinkamas paieškos užklausas ir rinkite informaciją iš interneto.
Rašymas: Ištrauka ir sudaro naujienų santraukas iš surinktos informacijos.
Apmąstymai: Kritiką santraukos tikrindamas, ar nėra faktinio teisingumo, ir siūlo patobulinti.
Tobulinimas: Patobulina santraukas, remiantis kritika.
Antraštės karta: Sugeneruoja tinkamas antraštes kiekvienai naujienų santraukai.

Norėdami pagerinti naudojimą, mes taip pat sukursime paprastą GUI, naudodami „Streamlit“. Panašiai kaip ir ankstesniuose vadovėliuose, mes naudosime Groq LLM pagrįstai apdorojimui ir Niūrus Naršyti internete. Iš jų atitinkamų svetainių galite generuoti nemokamus API raktus.

Aplinkos nustatymas

Pirmiausia nustatome aplinkos kintamuosius, diegdami reikiamas bibliotekas ir importuodami būtinas priklausomybes:

Įdiekite reikiamas bibliotekas

pip install langgraph==0.2.53 langgraph-checkpoint==2.0.6 langgraph-sdk==0.1.36 langchain-groq langchain-community langgraph-checkpoint-sqlite==2.0.1 tavily-python streamlit

Importuokite bibliotekas ir nustatykite API klavišus

import os
import sqlite3
from langgraph.graph import StateGraph
from langchain_core.messages import SystemMessage, HumanMessage
from langchain_groq import ChatGroq
from tavily import TavilyClient
from langgraph.checkpoint.sqlite import SqliteSaver
from typing import TypedDict, List
from pydantic import BaseModel
import streamlit as st

# Set API Keys
os.environ('TAVILY_API_KEY') = "your_tavily_key"
os.environ('GROQ_API_KEY') = "your_groq_key"

# Initialize Database for Checkpointing
sqlite_conn = sqlite3.connect("checkpoints.sqlite", check_same_thread=False)
memory = SqliteSaver(sqlite_conn)

# Initialize Model and Tavily Client
model = ChatGroq(model="Llama-3.1-8b-instant")
tavily = TavilyClient(api_key=os.environ("TAVILY_API_KEY"))

Agento būsenos apibrėžimas

Agentas visą savo darbo eigą palaiko valstybės informaciją:

Tema: Tema, apie kurią vartotojas nori naujausių naujienų projektų: pirmieji naujienų santraukų projektai
Turinys: Tyrimo turinys, išgautas iš „Tavily“ paieškos rezultatų
Kritika: Kritika ir rekomendacijos, gautos atsižvelgiant į projektą apmąstymų valstybėje.
Patobulintos santraukos: Atnaujintos naujienų santraukos, įtraukus į kritikos pasiūlymus

Antraštės: Antraštės, sugeneruotos kiekvienai naujienų straipsnių klasei

class AgentState(TypedDict):
    topic: str
    drafts: List(str)
    content: List(str)
    critiques: List(str)
    refined_summaries: List(str)
    headings: List(str)

Apibrėžti raginimus

Mes apibrėžiame kiekvieno agento darbo eigos etapo sistemos raginimus:

BROWSING_PROMPT = """You are an AI news researcher tasked with finding the latest news articles on given topics. Generate up to 3 relevant search queries."""

WRITER_PROMPT = """You are an AI news summarizer. Write a detailed summary (1 to 2 paragraphs) based on the given content, ensuring factual correctness, clarity, and coherence."""

CRITIQUE_PROMPT = """You are a teacher reviewing draft summaries against the source content. Ensure factual correctness, identify missing or incorrect details, and suggest improvements.
----------
Content: {content}
----------"""

REFINE_PROMPT = """You are an AI news editor. Given a summary and critique, refine the summary accordingly.
-----------
Summary: {summary}"""

HEADING_GENERATION_PROMPT = """You are an AI news summarizer. Generate a short, descriptive headline for each news summary."""

Užklausų ir naujienų struktūrizavimas

Mes naudojame „Pydantic“, kad apibrėžtume užklausų ir naujienų straipsnių struktūrą. „Pydantic“ leidžia mums apibrėžti LLM išvesties struktūrą. Tai svarbu, nes mes norime, kad užklausos būtų eilutės sąrašas, o iš interneto ištrauktas turinys turės kelis naujienų straipsnius, taigi ir eilučių sąrašą.

from pydantic import BaseModel

class Queries(BaseModel):
    queries: List(str)

class News(BaseModel):
    news: List(str)

AI agentų įgyvendinimas

1. Naršymo mazgas

Šis mazgas sukuria paieškos užklausas ir gauna atitinkamą turinį iš interneto.

def browsing_node(state: AgentState):
    queries = model.with_structured_output(Queries).invoke((
        SystemMessage(content=BROWSING_PROMPT),
        HumanMessage(content=state('topic'))
    ))
    content = state.get('content', ())
    for q in queries.queries:
        response = tavily.search(query=q, max_results=2)
        for r in response('results'):
            content.append(r('content'))
    return {"content": content}

2. Rašymo mazgas

Ištraukia naujienų santraukas iš gauto turinio.

def writing_node(state: AgentState):
    content = "\n\n".join(state('content'))
    news = model.with_structured_output(News).invoke((
        SystemMessage(content=WRITER_PROMPT),
        HumanMessage(content=content)
    ))
    return {"drafts": news.news}

3. Atspindžio mazgas

Kritika sugeneruotas suvestinėmis atsižvelgiant į turinį.

def reflection_node(state: AgentState):
    content = "\n\n".join(state('content'))
    critiques = ()
    for draft in state('drafts'):
        response = model.invoke((
            SystemMessage(content=CRITIQUE_PROMPT.format(content=content)),
            HumanMessage(content="draft: " + draft)
        ))
        critiques.append(response.content)
    return {"critiques": critiques}

4. Patobulinimo mazgas

Pagerina santraukas, remiantis kritika.

def refine_node(state: AgentState):
    refined_summaries = ()
    for summary, critique in zip(state('drafts'), state('critiques')):
        response = model.invoke((
            SystemMessage(content=REFINE_PROMPT.format(summary=summary)),
            HumanMessage(content="Critique: " + critique)
        ))
        refined_summaries.append(response.content)
    return {"refined_summaries": refined_summaries}

5. Antraštės kartos mazgas

Sukurkite trumpą antraštę kiekvienai naujienų santraukai.

def heading_node(state: AgentState):
    headings = ()
    for summary in state('refined_summaries'):
        response = model.invoke((
            SystemMessage(content=HEADING_GENERATION_PROMPT),
            HumanMessage(content=summary)
        ))
        headings.append(response.content)
    return {"headings": headings}

UI kūrimas su „Streamlit“

# Define Streamlit app
st.title("News Summarization Chatbot")

# Initialize session state
if "messages" not in st.session_state:
    st.session_state("messages") = ()

# Display past messages
for message in st.session_state("messages"):
    with st.chat_message(message("role")):
        st.markdown(message("content"))

# Input field for user
user_input = st.chat_input("Ask about the latest news...")

thread = 1
if user_input:
    st.session_state("messages").append({"role": "user", "content": user_input})
    with st.chat_message("assistant"):
        loading_text = st.empty()
        loading_text.markdown("*Thinking...*")

        builder = StateGraph(AgentState)
        builder.add_node("browser", browsing_node)
        builder.add_node("writer", writing_node)
        builder.add_node("reflect", reflection_node)
        builder.add_node("refine", refine_node)
        builder.add_node("heading", heading_node)
        builder.set_entry_point("browser")
        builder.add_edge("browser", "writer")
        builder.add_edge("writer", "reflect")
        builder.add_edge("reflect", "refine")
        builder.add_edge("refine", "heading")
        graph = builder.compile(checkpointer=memory)

        config = {"configurable": {"thread_id": f"{thread}"}}
        for s in graph.stream({"topic": user_input}, config):
            # loading_text.markdown(f"*{st.session_state('loading_message')}*")
            print(s)
        
        s = graph.get_state(config).values
        refined_summaries = s('refined_summaries')
        headings = s('headings')
        thread+=1
        # Display final response
        loading_text.empty()
        response_text = "\n\n".join((f"{h}\n{s}" for h, s in zip(headings, refined_summaries)))
        st.markdown(response_text)
        st.session_state("messages").append({"role": "assistant", "content": response_text})

Išvada

Šis vadovėlis apėmė visą AI varomų naujienų apibendrinimo agento kūrimo procesą paprastu supaprastintu UI. Dabar galite žaisti su tuo ir padaryti dar keletą patobulinimų, pavyzdžiui,:

A Geresnis GUI Norėdami sustiprinti vartotojo sąveiką.
Įtraukdamas Iteracinis tobulinimas Norėdami įsitikinti, kad santraukos yra tikslios ir tinkamos.
Išlaikykite kontekstą tęsti pokalbį apie tam tikras naujienas.

Laimingas kodavimas!

Taip pat nedvejodami sekite mus „Twitter“ Ir nepamirškite prisijungti prie mūsų 75K+ ml subreddit.

🚨 Rekomenduojama atvirojo kodo AI platforma: „„ Intellagent “yra atvirojo kodo daugialypės terpės sistema, skirta įvertinti sudėtingą pokalbio AI sistemą“ _{(Paaukštintas)}

„Vineet Kumar“ yra „MarkTechPost“ konsultavimo praktikantas. Šiuo metu jis siekia savo BS iš Indijos technologijos instituto (IIT), Kanpur. Jis yra mašinų mokymosi entuziastas. Jis aistringai vertina tyrimus ir naujausius giluminio mokymosi, kompiuterinės vizijos ir susijusių sričių pažangą.

✅ (rekomenduojama) Prisijunkite prie mūsų telegramos kanalo

Source link

Žingsnis po žingsnio vadovas, kaip sukurti AI naujienų santrauką naudojant „Streamlit“, „Groq“ ir „Tavily“

Įvadas

Aplinkos nustatymas

Agento būsenos apibrėžimas

Apibrėžti raginimus

Užklausų ir naujienų struktūrizavimas

AI agentų įgyvendinimas

1. Naršymo mazgas

2. Rašymo mazgas

3. Atspindžio mazgas

4. Patobulinimo mazgas

5. Antraštės kartos mazgas

UI kūrimas su „Streamlit“

Išvada

Paskutinės naujienos

statomi tiltai, tvarkomos gatvės, atnaujinamos viešosios erdvės

Kritiniai Fortinet FortiSandbox trūkumai dabar naudojami atakose

Kredito unijų sektorius pirmąjį ketvirtį – pelno daugiau nei prieš metus

Ar „AI burbulas“ sprogs 2025 m. pabaigoje ar 2026 m.?

Įvadas

Aplinkos nustatymas

Agento būsenos apibrėžimas

Apibrėžti raginimus

Užklausų ir naujienų struktūrizavimas

AI agentų įgyvendinimas

1. Naršymo mazgas

2. Rašymo mazgas

3. Atspindžio mazgas

4. Patobulinimo mazgas

5. Antraštės kartos mazgas

UI kūrimas su „Streamlit“

Išvada

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Paskutinės naujienos

statomi tiltai, tvarkomos gatvės, atnaujinamos viešosios erdvės

Kritiniai Fortinet FortiSandbox trūkumai dabar naudojami atakose

Kredito unijų sektorius pirmąjį ketvirtį – pelno daugiau nei prieš metus

Ar „AI burbulas“ sprogs 2025 m. pabaigoje ar 2026 m.?