Spaces:

giampaoloranaldi2369
/

Zenone

Runtime error

App Files Files Community

giampaoloranaldi2369 commited on Mar 14, 2025

Commit

3d0f892

verified ·

1 Parent(s): 88ab43f

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -80

app.py CHANGED Viewed

@@ -1,116 +1,77 @@
-import os
 import gradio as gr
 import requests
-import pickle
-import threading
 import time
-import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
-from langchain_community.vectorstores import FAISS
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.document_loaders import TextLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-### 📌 STEP 1: Caricare il documento ###
-file_path = "dizionario.txt"  # Il file deve essere caricato nella repository
-cache_path = "cached_documents.pkl"  # Cache per evitare ricalcoli
-# Verifica se il file esiste
-if not os.path.exists(file_path):
-    raise FileNotFoundError(f"Il file {file_path} non esiste! Caricalo nella repository di Hugging Face.")
-# Se il file è già processato, carica la cache
-if os.path.exists(cache_path):
-    print("✅ Caricamento degli embeddings dalla cache...")
-    with open(cache_path, "rb") as f:
-        vectorstore = pickle.load(f)
-else:
-    print("📄 Elaborazione del documento in corso...")
-    loader = TextLoader(file_path, encoding="utf-8")
     documents = loader.load()
-    # Dividere il testo in frammenti per la ricerca
-    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
-    texts = text_splitter.split_documents(documents)
-    embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
-    vectorstore = FAISS.from_documents(texts, embeddings)
-    # Salva gli embeddings nella cache
-    with open(cache_path, "wb") as f:
-        pickle.dump(vectorstore, f)
-    print(f"✅ {len(texts)} frammenti di testo elaborati e salvati!")
-### 📌 STEP 2: Funzioni di ricerca ###
 def search_docs(query):
-    """ Cerca la query nei documenti caricati. """
     results = vectorstore.similarity_search(query, k=3)
-    if not results:
-        return "⚠️ Nessuna informazione trovata nei documenti."
-    return results
 def search_web(query):
-    """ Cerca la query su Google tramite SerpAPI o Perplexity. """
-    api_key = "TUA_CHIAVE_API"  # Inserisci la tua API key
     url = f"https://serpapi.com/search?q={query}&api_key={api_key}"
     try:
         response = requests.get(url).json()
         if "organic_results" in response:
             return response["organic_results"][:3]
-        return ["⚠️ Nessuna informazione trovata sul web."]
     except Exception as e:
         return [f"❌ Errore nella ricerca web: {e}"]
-### 📌 STEP 3: Caricamento del modello ###
-model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"  # Usa "TinyLlama/TinyLlama-1.1B-Chat-v1.0" se necessario
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
-### 📌 STEP 4: Funzione principale del chatbot ###
 def chatbot_response(query):
-    """ Cerca la risposta nei documenti, sul web e usa il modello per generare testo. """
-    # ✅ Cerca nei documenti con FAISS
     docs = search_docs(query)
-    doc_response = docs[0].page_content if isinstance(docs, list) and docs else "⚠️ Nessuna informazione trovata nei documenti."
-    # ✅ Cerca sul web con Perplexity o SerpAPI
     web_results = search_web(query)
-    web_response = web_results[0]["snippet"] if isinstance(web_results, list) and web_results else "⚠️ Nessuna informazione trovata sul web."
-    # ✅ Genera una risposta con il modello selezionato
-    try:
-        input_text = f"Domanda: {query}\nRisposta:"
-        inputs = tokenizer(input_text, return_tensors="pt").to("cuda" if torch.cuda.is_available() else "cpu")
-        output = model.generate(**inputs, max_new_tokens=100)
-        model_response = tokenizer.decode(output[0], skip_special_tokens=True)
-    except Exception as e:
-        model_response = f"❌ Errore nel modello: {e}"
-    return f"📚 **Dai documenti:** {doc_response}\n🌐 **Dal web:** {web_response}\n🤖 **LLM:** {model_response}"
-### 📌 STEP 5: Attiva Keep-Alive per evitare lo spegnimento su Hugging Face Spaces ###
 def keep_alive():
-    """ Ping Hugging Face Spaces per evitare timeout. """
     while True:
-        try:
-            requests.get("https://huggingface.co/spaces/TUO_SPACE")  # Cambia con il tuo URL
-        except:
-            pass
-        time.sleep(600)  # Pinga ogni 10 minuti
-threading.Thread(target=keep_alive, daemon=True).start()
-### 📌 STEP 6: Avvia l'interfaccia del chatbot ###
-gr.Interface(fn=chatbot_response, inputs="text", outputs="text", title="Chatbot Personalizzato con Documenti e Web").launch()

 import gradio as gr
 import requests
 import time
+from huggingface_hub import login
 from langchain_huggingface import HuggingFaceEmbeddings
+from langchain_community.vectorstores import FAISS
 from langchain_community.document_loaders import TextLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+# 🔐 Autenticazione Hugging Face per modelli gated
+HF_TOKEN = "TUA_HUGGINGFACE_TOKEN"  # 🔴 INSERISCI IL TUO TOKEN QUI
+login(HF_TOKEN)
+# 📌 Sostituisci "google/gemma-2b" con un modello pubblico se necessario
+model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"  # 🔄 Modello alternativo pubblico
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name, torch_dtype=torch.float16, device_map="auto"
+)
+# 📄 Caricamento del dizionario e gestione UTF-8
+try:
+    loader = TextLoader("dizionario.txt", encoding="utf-8")
     documents = loader.load()
+except Exception as e:
+    print(f"❌ Errore nel caricamento del dizionario: {e}")
+    documents = []
+# 🔍 Creazione degli embeddings
+text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
+texts = text_splitter.split_documents(documents)
+embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+vectorstore = FAISS.from_documents(texts, embeddings) if texts else None
+# 🔎 Ricerca nei documenti
 def search_docs(query):
+    if not vectorstore:
+        return "⚠️ Il database di documenti non è disponibile."
     results = vectorstore.similarity_search(query, k=3)
+    return results if results else ["⚠️ Nessuna informazione trovata nei documenti."]
+# 🌐 Ricerca web con gestione errori
 def search_web(query):
+    api_key = "TUA_CHIAVE_API"  # 🔴 INSERISCI LA TUA API KEY
     url = f"https://serpapi.com/search?q={query}&api_key={api_key}"
     try:
         response = requests.get(url).json()
         if "organic_results" in response:
             return response["organic_results"][:3]
+        return ["⚠️ Nessun risultato trovato."]
     except Exception as e:
         return [f"❌ Errore nella ricerca web: {e}"]
+# 🤖 Generazione risposta del chatbot
 def chatbot_response(query):
     docs = search_docs(query)
     web_results = search_web(query)
+    doc_response = docs[0] if docs else "Nessuna informazione trovata nei documenti."
+    web_response = web_results[0]["snippet"] if web_results and isinstance(web_results[0], dict) else "Nessuna informazione trovata sul web."
+    return f"📚 **Dai documenti:** {doc_response}\n🌐 **Dal web:** {web_response}"
+# 🔄 Keep-Alive per evitare timeout
 def keep_alive():
     while True:
+        print("🔄 Keep-alive attivo...")
+        time.sleep(600)  # Mantiene il processo attivo
+# 🚀 Avvio interfaccia Gradio
+gr.Interface(fn=chatbot_response, inputs="text", outputs="text", title="Chatbot Personalizzato").launch()