程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql 若何拔出隨機字符串數據的完成辦法

mysql 若何拔出隨機字符串數據的完成辦法

編輯：MySQL綜合教程

mysql 若何拔出隨機字符串數據的完成辦法。本站提示廣大學習愛好者：（mysql 若何拔出隨機字符串數據的完成辦法）文章只能為提供參考，不一定能成為您想要的結果。以下是mysql 若何拔出隨機字符串數據的完成辦法正文

運用場景：
有時須要測試拔出數據庫的記載來測試，所以就異常須要用到這些劇本。

創立表：

CREATE TABLE `tables_a` (
  `id` int(10) NOT NULL DEFAULT '0',
  `name` char(50) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

創立發生隨機字符串的函數：

set global log_bin_trust_function_creators = 1;
DROP FUNCTION IF EXISTS rand_string;
DELIMITER //
CREATE FUNCTION rand_string(n INT)
RETURNS VARCHAR(255)
BEGIN
        DECLARE chars_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
        DECLARE return_str varchar(255) DEFAULT '';
        DECLARE i INT DEFAULT 0;
        WHILE i < n DO
                SET return_str = concat(return_str,substring(chars_str , FLOOR(1 + RAND()*62 ),1));
                SET i = i +1;
        END WHILE;
        RETURN return_str;
END //
delimiter ;

創立拔出表的procedure,x是從若干開端。y是若干停止，z是發生若干位隨機數

delimiter // 
create procedure test(x int(10),y int(10),z int(10))
begin
  DECLARE i INT DEFAULT x;
  while i<y do
 insert into tables_a values(i,rand_string(z));
 set i=i+1;
 end whi

mysql隨機數據生成並拔出

dblp數據庫中援用信息很少，均勻一篇論文援用0.2篇。應用dblp做試驗數據集的某篇論文提到，可以隨機添加援用信息。受此啟示，我盤算為每篇論文都添加20篇隨機援用，因而就寫出了以下的sql語句：

String sql = "insert into citation(pId1,pId2) values( (select pId from papers limit ?,1),(select pId from papers limit ?,1))";

應用preparedstatement，以batch方法提交數據庫。

第一個參數是paper的rowid信息，從0~N（N為papers的total row）。第二個參數是Java生成的20個不反復的隨機數，規模是0-N。然後嵌套在for輪回裡，每1w條數據提交給數據庫一次。

這段代碼奇妙應用limit的特征完成隨機選tuple，原來是暗暗自得的。自認為把一切的select都交給數據庫去做了，省去了經由過程jdbc的屢次銜接，應當是很快便可以運轉完成的。哪知，插了不外10w條（10000*10）數據，就耗時22分鐘之多。終究的試驗須要拔出400w條數據，也就是說要花14h閣下。

因而開端反思，赓續做寫相似的法式查找時光瓶頸，終究鎖定在select limit，這個操作極耗時光。現在選用limit，緣由在於：隨機生成的是數字，要把數字映照到tuple，也就是對應到rowid；因為papers表的主鍵並不是遞增int，所以默許的rowid不存在。後來一想，可以在papers表上先增長一個auto_increment的temp列，完成citation拔出後再刪除。如許sql語句就改成了：

String sql = "insert into citation(pId1,pId2) values((select pId from papers where temp=?), (select pId from papers where temp=?))";

再一次拔出10w條數據，耗時38s。效力年夜幅進步，但不曉得還可弗成以進一步優化。