Initial Commit

jexp · jexp · commit 0d89dacf4782 · 2023-09-13T14:04:04.000+02:00
diff --git a/.gitignore b/.gitignore
@@ -0,0 +1,2 @@
+.env
+
diff --git a/Dockerfile b/Dockerfile
@@ -0,0 +1,9 @@
+FROM python:latest
+
+COPY requirements.txt .
+# COPY .env .
+COPY app.py .
+
+RUN pip install -r requirements.txt
+
+CMD ["python", "app.py"]
diff --git a/app.py b/app.py
@@ -0,0 +1,61 @@
+import os
+
+from langchain.vectorstores.neo4j_vector import Neo4jVector
+from langchain.document_loaders import WikipediaLoader
+from langchain.embeddings.openai import OpenAIEmbeddings
+from langchain.text_splitter import CharacterTextSplitter
+from langchain.docstore.document import Document
+from dotenv import load_dotenv
+
+load_dotenv('.env')
+
+url = os.getenv('NEO4J_URI')
+username = os.getenv('NEO4J_USERNAME')
+password = os.getenv('NEO4J_PASSWORD')
+page = os.getenv('WIKIPEDIA_PAGE') or "Sweden"
+prompt = os.getenv('PROMPT') or "What is the second largest city in Sweden?"
+
+os.environ["NEO4J_URL"] = url
+
+embeddings = OpenAIEmbeddings()
+
+# Read the wikipedia article
+raw_documents = WikipediaLoader(query=page).load()
+
+# Define chunking strategy
+text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
+    chunk_size=1000, chunk_overlap=20
+)
+# Chunk the document
+documents = text_splitter.split_documents(raw_documents)
+# Remove the summary
+for d in documents:
+    del d.metadata["summary"]
+
+neo4j_db = Neo4jVector.from_documents(
+    documents,
+    embedding=embeddings,
+    url=url,
+    username=username,
+    password=password,
+    database="neo4j",  # neo4j by default
+    index_name="wikipedia",  # vector by default
+    node_label="WikipediaArticle",  # Chunk by default
+    text_node_property="info",  # text by default
+    embedding_node_property="vector",  # embedding by default
+    create_id_index=True,  # True by default
+)
+
+neo4j_db.add_documents(
+    [
+        Document(
+            page_content="LangChain is the coolest library since the Library of Alexandria",
+            metadata={"author": "Tomaz", "confidence": 1.0}
+        )
+    ],
+    ids=["langchain"],
+)
+
+result = neo4j_db.similarity_search(prompt, k=1)
+
+print(result)
diff --git a/docker-compose.yml b/docker-compose.yml
@@ -0,0 +1,32 @@
+version: '3'
+services:
+
+  database:
+    image: neo4j:latest
+    ports:
+      - 7687:7687
+      - 7474:7474
+    environment:
+      - NEO4J_AUTH=neo4j/password
+#      - NEO4J_ACCEPT_LICENSE_AGREEMENT=developer
+    networks:
+      - net
+
+  langchain-app:
+    build: .
+
+    environment:
+      - NEO4J_URI=neo4j://database:7687
+      - NEO4J_PASSWORD=password
+      - NEO4J_USERNAME=neo4j
+      - OPENAI_API_KEY=${OPENAI_API_KEY}
+    networks:
+      - net
+    depends_on:
+      - database
+
+    ports:
+      - 8080:8080
+
+networks:
+  net:
diff --git a/example.env b/example.env
@@ -0,0 +1,4 @@
+OPENAI_API_KEY=sk-...
+NEO4J_URI=neo4j://localhost:7687
+NEO4J_USERNAME=neo4j
+NEO4J_PASSWORD=password
diff --git a/readme.md b/readme.md
@@ -0,0 +1,22 @@
+# LangChain Docker Starter Kits
+
+
+## Create Graph App
+
+### Endpoints 
+
+* `/add_page?title=pagename`
+* `/clear`
+
+## QA Bot App (RAG)
+
+* `/answer?title=
+
+For control plane / extension - or env-variables
+
+* `/prompt` POST / GET
+* `/configure` (temperature, top-k, ...)
+
+## Neo4j
+
+
diff --git a/requirements.txt b/requirements.txt
@@ -0,0 +1,6 @@
+langchain
+openai
+python-dotenv
+wikipedia
+tiktoken
+neo4j
diff --git a/start.sh b/start.sh
@@ -0,0 +1,3 @@
+docker run --name neo4j -e NEO4J_AUTH=neo4j/password -p 7687:7687 -p 7474:7474 neo4j:latest
+
+# docker ps -qaf name=neo4j

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+docker run --name neo4j -e NEO4J_AUTH=neo4j/password -p 7687:7687 -p 7474:7474 neo4j:latest`
	`2`	`+`
	`3`	`+# docker ps -qaf name=neo4j`