
设计一个简单的问答匹配系统,核心是将用户提出的问题与已有知识库中的标准问题进行匹配,并返回对应的答案。MySQL 可用于存储问题、答案及匹配关键词。以下是实现思路和具体表结构设计。
1. 数据库表结构设计
创建两个主要表:问题表(questions)和关键词表(keywords),通过关键词提升匹配准确率。
问题表(questions)
- id: 主键
- question_text: 标准问题文本
- answer: 对应答案
- match_count: 匹配次数(可选,用于优化热门问题)
关键词表(keywords)
- id: 主键
- question_id: 外键,关联到 questions.id
- keyword: 用于匹配的关键词(如“登录”、“密码”、“注册”)
示例 SQL:
CREATE TABLE questions ( id INT AUTO_INCREMENT PRIMARY KEY, question_text TEXT NOT NULL, answer TEXT NOT NULL, match_count INT DEFAULT 0 ); CREATE TABLE keywords ( id INT AUTO_INCREMENT PRIMARY KEY, question_id INT, keyword VARCHAR(50) NOT NULL, FOREIGN KEY (question_id) REFERENCES questions(id) );
2. 插入数据示例
添加常见问题和对应关键词:
INSERT INTO questions (question_text, answer) VALUES ('如何找回密码?', '请在登录页点击“忘记密码”,按提示操作。'), ('怎么注册账号?', '访问首页,点击“注册”按钮完成信息填写。'); INSERT INTO keywords (question_id, keyword) VALUES (1, '找回'), (1, '密码'), (1, '忘记'), (2, '注册'), (2, '账号'), (2, '注册账号');
3. 实现问题匹配逻辑
当用户输入一个问题时,提取其中的词汇,查找包含这些词的关键词记录,统计每个问题的匹配次数,取最高匹配的问题作为结果。
例如,用户问:“忘记密码怎么办?”
拆分出关键词:“忘记”、“密码”、“怎么办”
用 SQL 查找匹配的问题 ID:
SELECT question_id, COUNT(*) as score FROM keywords WHERE keyword IN ('忘记', '密码', '怎么办') GROUP BY question_id ORDER BY score DESC LIMIT 1;
获取 question_id 后,再从 questions 表中查出答案。
4. 提升匹配效果的小技巧
- 对用户输入做简单分词处理(可用程序语言如 python 分词,或使用模糊匹配)
- 统一转为小写,避免大小写影响
- 去除标点符号和停用词(如“吗”、“呢”、“怎么办”)
- 可加入 LIKE 模糊查询作为补充:
SELECT id, answer FROM questions WHERE question_text LIKE '%密码%' AND question_text LIKE '%找回%' LIMIT 1;
基本上就这些。系统虽简单,但能满足基础场景。随着需求增长,可引入全文索引(MySQL 的 FULLTEXT)或对接专门的搜索引擎。