Python RAG 关键词过滤
作者:追风剑情 发布于:2026-5-20 15:05 分类:AI
import requests
# ========== 初始化本地 Ollama 模型 ==========
OLLAMA_GENERATE_URL = "http://localhost:11434/api/generate"
GENERATE_MODEL = "deepseek-r1:7b" # 使用您本地的模型
def generate_response(query, retrieved_doc):
"""使用本地 Ollama 模型生成响应"""
prompt = f"""问题: {query}
相关文档内容: {retrieved_doc}
请基于以上文档内容回答问题。"""
response = requests.post(
OLLAMA_GENERATE_URL,
json={
"model": GENERATE_MODEL,
"prompt": prompt,
"stream": False,
"options": {
"temperature": 0.7,
"top_k": 50,
"top_p": 0.9
}
}
)
if response.status_code == 200:
return response.json()["response"]
else:
return f"生成失败: {response.status_code}"
def filter_response(response_text, forbidden_keywords):
"""
过滤生成的响应,检查是否包含禁止关键词
参数:
response_text: 生成的原始文本
forbidden_keywords: 禁止关键词列表
返回:
如果包含禁止关键词,返回过滤后的提示信息;
否则返回原始文本
"""
for keyword in forbidden_keywords:
if keyword in response_text:
return f"[已过滤] 生成的响应包含敏感词: '{keyword}',已阻止输出。"
return response_text
# ========== 示例1:正常内容(无敏感词)==========
print("=" * 60)
print("示例1:正常查询(无敏感词)")
print("=" * 60)
retrieved_doc = "法国是欧洲的一个国家,首都位于巴黎。巴黎以埃菲尔铁塔和卢浮宫闻名于世。"
query = "法国的首都是哪里?"
# 禁用关键词列表
forbidden_keywords = ["暴力", "色情", "非法", "仇恨", "歧视"]
print(f"查询: {query}")
print(f"检索到的文档: {retrieved_doc}")
print(f"禁止关键词: {forbidden_keywords}")
print()
# 生成响应并进行过滤
print("正在生成响应...")
response = generate_response(query, retrieved_doc)
print(f"生成的原始响应: {response}")
filtered_response = filter_response(response, forbidden_keywords)
print(f"过滤后的响应: {filtered_response}")
# ========== 示例2:包含敏感词的内容 ==========
print("\n" + "=" * 60)
print("示例2:包含敏感词的查询")
print("=" * 60)
retrieved_doc_sensitive = "某组织计划使用暴力和非法手段达成其政治目的。"
query_sensitive = "这个组织的计划是什么?"
print(f"查询: {query_sensitive}")
print(f"检索到的文档: {retrieved_doc_sensitive}")
print(f"禁止关键词: {forbidden_keywords}")
print()
# 生成响应并进行过滤
print("正在生成响应...")
response_sensitive = generate_response(query_sensitive, retrieved_doc_sensitive)
print(f"生成的原始响应: {response_sensitive}")
filtered_response_sensitive = filter_response(response_sensitive, forbidden_keywords)
print(f"过滤后的响应: {filtered_response_sensitive}")
# ========== 示例3:更高级的过滤函数 ==========
print("\n" + "=" * 60)
print("示例3:高级过滤(记录日志 + 关键词高亮)")
print("=" * 60)
def advanced_filter(response_text, forbidden_keywords, log_file="filter_log.txt"):
"""
高级过滤函数:
1. 检测敏感词
2. 记录日志到文件
3. 标记敏感词位置
"""
detected_keywords = []
for keyword in forbidden_keywords:
if keyword in response_text:
detected_keywords.append(keyword)
if detected_keywords:
# 记录日志
import datetime
log_entry = f"[{datetime.datetime.now()}] 检测到敏感词: {detected_keywords}\n文本: {response_text}\n"
with open(log_file, "a", encoding="utf-8") as f:
f.write(log_entry)
# 标记敏感词位置(用 *** 替换)
filtered = response_text
for kw in detected_keywords:
filtered = filtered.replace(kw, f"[***{kw}***]")
return f"[警告] 检测到敏感词 {detected_keywords},已记录日志。\n过滤后的文本: {filtered}"
else:
return response_text
# 测试高级过滤
test_text = "这篇文章包含暴力和色情内容,属于非法传播。"
print(f"测试文本: {test_text}")
result = advanced_filter(test_text, ["暴力", "色情", "非法"])
print(f"高级过滤结果:\n{result}")
标签: AI
日历
最新文章
随机文章
热门文章
分类
存档
- 2026年5月(14)
- 2026年4月(7)
- 2026年3月(15)
- 2026年2月(3)
- 2026年1月(6)
- 2025年12月(1)
- 2025年11月(1)
- 2025年9月(3)
- 2025年7月(4)
- 2025年6月(5)
- 2025年5月(1)
- 2025年4月(5)
- 2025年3月(4)
- 2025年2月(3)
- 2025年1月(1)
- 2024年12月(5)
- 2024年11月(5)
- 2024年10月(5)
- 2024年9月(3)
- 2024年8月(3)
- 2024年7月(11)
- 2024年6月(3)
- 2024年5月(9)
- 2024年4月(10)
- 2024年3月(11)
- 2024年2月(24)
- 2024年1月(12)
- 2023年12月(3)
- 2023年11月(9)
- 2023年10月(7)
- 2023年9月(2)
- 2023年8月(7)
- 2023年7月(9)
- 2023年6月(6)
- 2023年5月(7)
- 2023年4月(11)
- 2023年3月(6)
- 2023年2月(11)
- 2023年1月(8)
- 2022年12月(2)
- 2022年11月(4)
- 2022年10月(10)
- 2022年9月(2)
- 2022年8月(13)
- 2022年7月(7)
- 2022年6月(11)
- 2022年5月(18)
- 2022年4月(29)
- 2022年3月(5)
- 2022年2月(6)
- 2022年1月(8)
- 2021年12月(5)
- 2021年11月(3)
- 2021年10月(4)
- 2021年9月(9)
- 2021年8月(14)
- 2021年7月(8)
- 2021年6月(5)
- 2021年5月(2)
- 2021年4月(3)
- 2021年3月(7)
- 2021年2月(2)
- 2021年1月(8)
- 2020年12月(7)
- 2020年11月(2)
- 2020年10月(6)
- 2020年9月(9)
- 2020年8月(10)
- 2020年7月(9)
- 2020年6月(18)
- 2020年5月(4)
- 2020年4月(25)
- 2020年3月(38)
- 2020年1月(21)
- 2019年12月(13)
- 2019年11月(29)
- 2019年10月(44)
- 2019年9月(17)
- 2019年8月(18)
- 2019年7月(25)
- 2019年6月(25)
- 2019年5月(17)
- 2019年4月(10)
- 2019年3月(36)
- 2019年2月(35)
- 2019年1月(28)
- 2018年12月(30)
- 2018年11月(22)
- 2018年10月(4)
- 2018年9月(7)
- 2018年8月(13)
- 2018年7月(13)
- 2018年6月(6)
- 2018年5月(5)
- 2018年4月(13)
- 2018年3月(5)
- 2018年2月(3)
- 2018年1月(8)
- 2017年12月(35)
- 2017年11月(17)
- 2017年10月(16)
- 2017年9月(17)
- 2017年8月(20)
- 2017年7月(34)
- 2017年6月(17)
- 2017年5月(15)
- 2017年4月(32)
- 2017年3月(8)
- 2017年2月(2)
- 2017年1月(5)
- 2016年12月(14)
- 2016年11月(26)
- 2016年10月(12)
- 2016年9月(25)
- 2016年8月(32)
- 2016年7月(14)
- 2016年6月(21)
- 2016年5月(17)
- 2016年4月(13)
- 2016年3月(8)
- 2016年2月(8)
- 2016年1月(18)
- 2015年12月(13)
- 2015年11月(15)
- 2015年10月(12)
- 2015年9月(18)
- 2015年8月(21)
- 2015年7月(35)
- 2015年6月(13)
- 2015年5月(9)
- 2015年4月(4)
- 2015年3月(5)
- 2015年2月(4)
- 2015年1月(13)
- 2014年12月(7)
- 2014年11月(5)
- 2014年10月(4)
- 2014年9月(8)
- 2014年8月(16)
- 2014年7月(26)
- 2014年6月(22)
- 2014年5月(28)
- 2014年4月(15)
友情链接
- Unity官网
- Unity圣典
- Unity在线手册
- Unity中文手册(圣典)
- Unity官方中文论坛
- Unity游戏蛮牛用户文档
- Unity下载存档
- Unity引擎源码下载
- Unity服务
- Unity Ads
- wiki.unity3d
- Visual Studio Code官网
- SenseAR开发文档
- MSDN
- C# 参考
- C# 编程指南
- .NET Framework类库
- .NET 文档
- .NET 开发
- WPF官方文档
- uLua
- xLua
- SharpZipLib
- Protobuf-net
- Protobuf.js
- OpenSSL
- OPEN CASCADE
- JSON
- MessagePack
- C在线工具
- 游戏蛮牛
- GreenVPN
- 聚合数据
- 热云
- 融云
- 腾讯云
- 腾讯开放平台
- 腾讯游戏服务
- 腾讯游戏开发者平台
- 腾讯课堂
- 微信开放平台
- 腾讯实时音视频
- 腾讯即时通信IM
- 微信公众平台技术文档
- 白鹭引擎官网
- 白鹭引擎开放平台
- 白鹭引擎开发文档
- FairyGUI编辑器
- PureMVC-TypeScript
- 讯飞开放平台
- 亲加通讯云
- Cygwin
- Mono开发者联盟
- Scut游戏服务器引擎
- KBEngine游戏服务器引擎
- Photon游戏服务器引擎
- 码云
- SharpSvn
- 腾讯bugly
- 4399原创平台
- 开源中国
- Firebase
- Firebase-Admob-Unity
- google-services-unity
- Firebase SDK for Unity
- Google-Firebase-SDK
- AppsFlyer SDK
- android-repository
- CQASO
- Facebook开发者平台
- gradle下载
- GradleBuildTool下载
- Android Developers
- Google中国开发者
- AndroidDevTools
- Android社区
- Android开发工具
- Google Play Games Services
- Google商店
- Google APIs for Android
- 金钱豹VPN
- TouchSense SDK
- MakeHuman
- Online RSA Key Converter
- Windows UWP应用
- Visual Studio For Unity
- Open CASCADE Technology
- 慕课网
- 阿里云服务器ECS
- 在线免费文字转语音系统
- AI Studio
- 网云穿
- 百度网盘开放平台
- 迅捷画图
- 菜鸟工具
- [CSDN] 程序员研修院
- 华为人脸识别
- 百度AR导航导览SDK
- 海康威视官网
- 海康开放平台
- 海康SDK下载
- git download
- Open CASCADE
- CascadeStudio
- OpenClaw中文社区
- three.js manual
- SVG官方文档
交流QQ群
-
Flash游戏设计: 86184192
Unity游戏设计: 171855449
游戏设计订阅号







