MySql无限分类数据结构--预排序遍历树算法

Posted by admin on 2013, February 17

无限分类是我们开发中非常常见的应用,像论坛的的版块,CMS的类别,应用的地方特别多。

我们最常见最简单的方法就是在MySql里ID ,parentID,name。其优点是简单,结构简单;缺点是效率不高,因为每一次递归都要查询数据库,几百条数据时就不是很快了!

存储树是一种常见的问题,多种解决方案。主要有两种方法:邻接表的模型,并修改树前序遍历算法。

我们将探讨这两种方法的节能等级的数据。我会使用树从一个虚构的网上食品商店作为一个例子。这食品商店组织其食品类,通过颜色和类型。这棵树看起来像这样:

下面我们将用另外一种方法,这就是预排序遍历树算法(modified preorder tree traversal algorithm)

这种方法大家可能接触的比较少,初次使用也不像上面的方法容易理解,但是由于这种方法不使用递归查询算法,有更高的查询效率。

我们首先将多级数据按照下面的方式画在纸上,在根节点Food的左侧写上 1 然后沿着这个树继续向下 在 Fruit 的左侧写上 2 然后继续前进,沿着整个树的边缘给每一个节点都标上左侧和右侧的数字。最后一个数字是标在Food 右侧的 18。 在下面的这张图中你可以看到整个标好了数字的多级结构。(没有看懂?用你的手指指着数字从1数到18就明白怎么回事了。还不明白,再数一遍,注意移动你的手指)。

这些数字标明了各个节点之间的关系,”Red”的号是3和6,它是 “Food” 1-18 的子孙节点。 同样,我们可以看到 所有左值大于2和右值小于11的节点 都是”Fruit” 2-11 的子孙节点

如图所示:

这样整个树状结构可以通过左右值来存储到数据库中。继续之前,我们看一看下面整理过的数据表。

注意:由于”left”和”right”在 SQL中有特殊的意义,所以我们需要用”lft”和”rgt”来表示左右字段。 另外这种结构中不再需要”parent”字段来表示树状结构。也就是 说下面这样的表结构就足够了。

`SELECT * FROM tree WHERE lft BETWEEN 2 AND 11;

`

看到了吧,只要一个查询就可以得到所有这些节点。为了能够像上面的递归函数那样显示整个树状结构,我们还需要对这样的查询进行排序。用节点的左值进行排序:

SELECT * FROM tree WHERE lft BETWEEN 2 AND 11 ORDER BY lft ASC;

那么某个节点到底有多少子孙节点呢?很简单,子孙总数=(右值-左值-1)/2

descendants = (right – left - 1) / 2 ,如果不是很清楚这个公式,那就去翻下书,我们在上数据结构写的很清楚!

添加同一层次的节点的方法如下:

LOCK TABLE nested_category WRITE;

SELECT@myRight : = rgt FROM nested_category

WHERE name =’Cherry’;

UPDATE nested_category SET rgt = rgt +2WHERE rgt >@myRight;

UPDATE nested_category SET lft = lft +2WHERE lft >@myRight;

INSERTINTO nested_category(name, lft, rgt) VALUES(‘Strawberry ‘, @myRight+1, @myRight+2);

UNLOCK TABLES;

添加树的子节点的方法如下:

LOCK TABLE nested_category WRITE;

SELECT@myLeft : = lft FROM nested_category

WHERE name =’Beef’;

UPDATE nested_category SET rgt = rgt +2WHERE rgt >@myLeft;

UPDATE nested_category SET lft = lft +2WHERE lft >@myLeft;

INSERTINTO nested_category(name, lft, rgt) VALUES(‘charqui ‘, @myLeft+1, @myLeft+2);

UNLOCK TABLES;

每次插入节点之后都可以用以下SQL进行查看验证:

SELECT CONCAT( REPEAT( ‘’, (COUNT(parent.name) -1) ), node.name) AS name

FROM nested_category AS node,

nested_category AS parent

WHERE node.lft BETWEEN parent.lft AND parent.rgt

GROUPBY node.name

ORDERBY node.lft;

删除节点的方法,稍微有点麻烦是有个中间变量,如下:

LOCK TABLE nested_category WRITE;

SELECT@myLeft : = lft, @myRight := rgt, @myWidth := rgt - lft +1

FROM nested_category

WHERE name =’Cherry’;

DELETEFROM nested_category WHERE lft BETWEEN@myLeftAND@myRight ;

UPDATE nested_category SET rgt = rgt -@myWidthWHERE rgt >@myRight;

UPDATE nested_category SET lft = lft -@myWidthWHERE lft >@myRight;

UNLOCK TABLES;

这种方式就是有点难的理解,但是适合数据量很大规模使用,查看所有的结构只需要两条SQL语句就可以了,在添加节点和删除节点的时候略显麻烦,不过相对于效率来说还是值得的,这次发现让我发现了数据库结构真的很有用,但是我在学校学的树基本上都忘记了,这次遇到这个问题才应用到项目中!

参考文章:

http://dev.mysql.com/tech-resources/articles/hierarchical-data.html

http://www.sitepoint.com/article/hierarchical-data-database/3/