需求背景
目前主流的博客系統、CMS都會有一個TAG標簽系統,不僅可以讓內容鏈接的結構化增強,而且可以讓文章根據Tag來區分。相比傳統老式的Keyword模式,這種Tag模式可以單獨的設計一個Map的映射表來增加系統的負載和查詢的效率。
數據庫設計方案1
此方案分為2個表:
1.Tag表
2.文章表
Tag表表結構:
復制代碼 代碼如下:
tagid # tag標簽的ID
tagname #tag內容
num #當前Tag的引用個數
文章表結構:
復制代碼 代碼如下:
ID #文章ID
title #文章標題
tags #tags列表,多個以,分割
tagid #tags的ID 多個以,分割
...
此種方式Tag標簽主要內容保存在 文章表 中,對於Tag表的壓力較小,只是添加的時候更新一下Tag的引用數量,但是查詢的時候效率不足,不是好辦法
數據庫設計方案2
第二種方案使用2個Tag表,其中一個保存Tag信息,另一個保存映射信息:
Tag表:
復制代碼 代碼如下:
tagid # tag標簽的ID
tagname #tag內容
num #當前Tag的引用個數
Tagmap表
復制代碼 代碼如下:
tagid
aid
文章表
復制代碼 代碼如下:
ID #文章ID
title #文章標題
tags #tags列表,多個以,分割
...
這種形式,每次發布內容和修改內容的時候 都去更新一下Tag表和 Tagmap表。
查詢的時候需要從Tagmap表中查找響應的文章ID,然後使用文章ID去查詢具體的文章信息,因為每次查詢都是使用索引,所以效率較高。
數據庫設計方案3
前兩種方案都是使用純粹的Mysql來設計的,第三種方案將使用Nosql的魅力來設計。
基本結構同方案2,只是在Tag表和Tagmap表中使用mongo/redis這樣的nosql數據庫服務器,這樣可以發揮nosql數據庫強大的線性查詢能力。
1) 第一種方式的表結構設計與方案2完全相同,只是數據庫服務器換了。
2)其他的方案,當然是發揮Nosql的線性能力來設計存儲的Key了,尤其是使用redis的時候,使用的Key的結構可以完美的提高查詢效率
表結構的設計,沒有什麼不好
不過索引的設計,可以考慮一下
比如
1、t_Tags_SpaceArticle表的聚集索引可以刪除,保留唯一約束
因為數據插入和更新時,會按聚集索引順序調整數據,造成效率比較低下
2、創建ArticleId 字段的索引,因為你要按日志,搜索出它的Tag,所以需要這個索引
3、創建TagId 字段的索引,因為你要按2搜索出的Tag,搜索出它的相關日志,所以需要這個索引
基本上,上面3步就可以解決你的問題了,如果還想提高效率,那就要對t_Tags_SpaceArticle表進行分區了,分區可以按TagId 進行計算後分區
明確問題好嗎?