Name	Name	Last commit message	Last commit date
parent directory ..
config_moderation	config_moderation
README.md	README.md
app.py	app.py

Name

Last commit message

Last commit date

GuardRail-LLM: Uygulama 7 - İçerik Üretimi ve Moderasyon Senaryosu

🧩 Giriş

Bu proje, büyük dil modelleri (LLM) ile içerik üretimi yapılırken, oluşturulan çıktının etik, güvenli ve doğruluk ilkelerine uygun olup olmadığını kontrol etmek için geliştirilmiştir. Moderasyon sisteminde üç aşamalı bir koruma uygulanır:

Kendine zarar verme niyeti tespiti
Dezenformasyon kontrolü
Toksik içerik filtreleme (Python aksiyonu ile)

LLM olarak flan-t5-base, toksisite sınıflandırıcısı olarak unitary/toxic-bert, kontrol sistemi olarak ise Nemo Guardrails kullanılmıştır.

🚀 Kurulum

python -m venv venv
source venv/bin/activate  # Windows için: venv\Scripts\activate

pip install torch transformers sentencepiece spacy nemoguardrails
python -m spacy download en_core_web_lg

🛠️ Kullanım

python app.py

Bu komut sistemi başlatır ve aşağıdaki test senaryolarını otomatik olarak çalıştırır.

🔬 Test Senaryoları

Test	Açıklama	Beklenen Sonuç
Test 1	Güvenli içerik üretimi	Koruma devreye girmemeli
Test 2	Toksik içerik üretimi	Python aksiyonu ile engellenmeli
Test 3	Dezenformasyon	Guardrails kuralları ile engellenmeli
Test 4	Kendine zarar verme	Hemen yardım mesajı verilmeli

✨ Özellikler

💬 İçerik üretimi için LLM (Flan-T5)
🧠 Python destekli aksiyon ile toksisite kontrolü
🛡️ Katmanlı Guardrails koruması (intihar, yanlış bilgi, saldırganlık)
⚙️ Otomatik test süiti
✅ Gerçek zamanlı çıktı moderasyonu

📦 Bağımlılıklar

transformers
torch
sentencepiece
spacy
nemoguardrails
unitary/toxic-bert (transformers üzerinden yüklenir)

👥 Katkıda Bulunanlar

Bilgisayar Kavramları

📝 Lisans

Bu proje MIT lisansı ile lisanslanmıştır. Detaylar için LICENSE dosyasına bakabilirsiniz.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

GuardRail-LLM: Uygulama 7 - İçerik Üretimi ve Moderasyon Senaryosu

🧩 Giriş

📚 İçindekiler

🚀 Kurulum

🛠️ Kullanım

🔬 Test Senaryoları

✨ Özellikler

📦 Bağımlılıklar

👥 Katkıda Bulunanlar

📝 Lisans

FilesExpand file tree

uygulama7_Icerik

Directory actions

More options

Directory actions

More options

Latest commit

History

uygulama7_Icerik

Folders and files

parent directory

README.md

GuardRail-LLM: Uygulama 7 - İçerik Üretimi ve Moderasyon Senaryosu

🧩 Giriş

📚 İçindekiler

🚀 Kurulum

🛠️ Kullanım

🔬 Test Senaryoları

✨ Özellikler

📦 Bağımlılıklar

👥 Katkıda Bulunanlar

📝 Lisans