程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP,Mysql-根據一個給定經緯度的點,進行附近地點查詢–合理利用算法,效率提高2125倍,mysql-2125倍

PHP,Mysql-根據一個給定經緯度的點,進行附近地點查詢–合理利用算法,效率提高2125倍,mysql-2125倍

編輯:關於PHP編程

PHP,Mysql-根據一個給定經緯度的點,進行附近地點查詢–合理利用算法,效率提高2125倍,mysql-2125倍


目前的工作是需要對用戶的一些數據進行分析,每個用戶都有若干條記錄,每條記錄中有用戶的一個位置,是用經度和緯度表示的。
還有一個給定的數據庫,存儲的是一些已知地點以及他們的經緯度,內有43W多條的數據。
現在需要拿用戶的經緯度和已知地點進行距離匹配,如果它們之間的距離小於一定的數據,比如說500米,就認為用戶是在這個地點。
MYSQL本身是支持空間索引的,但是在5.x的版本中,取消了對Distance()和Related()的支持,參考這裡:MySQL 5.1參考手冊 :: 19. 中的空間擴展 19.5.6. 測試幾何類之間空間關系的函數, 無法使用空間的距離函數去直接去查詢距離在一定范圍內的點。所以,我首先想到的是,對每條記錄,去進行遍歷,跟數據庫中的每一個點進行距離計算,當距離小 於500米時,認為匹配。這樣做確實能夠得到結果,但是效率極其低下,因為每條記錄都要去循環匹配40W條數據,其消耗的時間可想而知。經過記錄,發現每 條記錄處理的時間消耗達到1700ms,針對每天上億的數據量,這樣一個處理速度,讓人情何以堪啊。。。
我自己也有個想法,就是找到每條記錄所在點的經緯度周圍的一個大概范圍,比方說正方形的四個點,然後使用mysql的空間計算,使用MBR去得出點在這個矩形內的已知記錄,然後進行匹配。可惜,自己沒想出能計算到四個點經緯度的方法。
意外的,查詢到了一個關於這個計算附近地點搜索初探,裡面使用python實現了這個想法。
所以參考了一下原文中的算法,使用PHP進行了實現。
實現原理也是很相似的,先算出該點周圍的矩形的四個點,然後使用經緯度去直接匹配數據庫中的記錄。

紅色部分為要求的搜索范圍,綠色部分我們能間接得到的結果范圍

紅色部分為要求的搜索范圍,綠色部分我們能間接得到的結果范圍

 

參考wiki百科上的一些球面計算公式:

  • Great-circle distance
  • Haversine formula

假設已知點的經緯度分別為$lng, $lat
先實現經度范圍的查詢,
在haversin公式中令φ1 = φ2,可得:

用PHP進行計算,就是:

Example 1 2 3 //$lat 已知點的緯度 $dlng =  2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat))); $dlng = rad2deg($dlng);//轉換弧度

然後是緯度范圍的查詢,
在haversin公式中令 Δλ = 0,可得

在PHP中進行計算,就是:

Example 1 2 $dlat = $distance/EARTH_RADIUS;//EARTH_RADIUS地球半徑 $dlat = rad2deg($dlat);//轉換弧度

最後,就可以得出四個點的坐標:
left-top : (lat + dlat, lng – dlng)
right-top : (lat + dlat, lng + dlng)
left-bottom : (lat – dlat, lng – dlng)
right-bottom: (lat – dlat, lng + dlng)

我把以上方法寫成了一個函數,綜合起來就是:

Example 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 define(EARTH_RADIUS, 6371);//地球半徑,平均半徑為6371km  /**  *計算某個經緯度的周圍某段距離的正方形的四個點  *  *@param lng float 經度  *@param lat float 緯度  *@param distance float 該點所在圓的半徑,該圓與此正方形內切,默認值為0.5千米  *@return array 正方形的四個點的經緯度坐標  */  function returnSquarePoint($lng, $lat,$distance = 0.5){       $dlng =  2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat)));     $dlng = rad2deg($dlng);           $dlat = $distance/EARTH_RADIUS;     $dlat = rad2deg($dlat);           return array(                 'left-top'=>array('lat'=>$lat + $dlat,'lng'=>$lng-$dlng),                 'right-top'=>array('lat'=>$lat + $dlat, 'lng'=>$lng + $dlng),                 'left-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng - $dlng),                 'right-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng + $dlng)                 );  } //使用此函數計算得到結果後,帶入sql查詢。 $squares = returnSquarePoint($lng, $lat); $info_sql = "select id,locateinfo,lat,lng from `lbs_info` where lat<>0 and lat>{$squares['right-bottom']['lat']} and lat<{$squares['left-top']['lat']} and lng>{$squares['left-top']['lng']} and lng<{$squares['right-bottom']['lng']} ";

在lat和lng上建立一個聯合索引後,使用此項查詢,每條記錄的查詢消耗平均為0.8毫秒,相比以前的1700ms,真的是天壤之別啊。效率真真的是以前的2125倍~~

總結:這應該也不是效率最好的辦法,但是效率比以前確實有明顯的提升。請記住,總有辦法更好的。

原文鏈接:http://digdeeply.org/archives/06152067.html


如果輸入一個經緯度數據,查詢出這個地點屬於那個地區,這樣的數據庫該怎建立

用北京天創的軟件
 

sql (mysql)實現查詢某一個經緯度周圍500米距離的餐館,數據庫存放所有餐館的經緯度

mysql兩點間距,你也自己弄成函數

公式如下,單位米:
第一點經緯度:lng1 lat1
第二點經緯度:lng2 lat2
round(6378.138*2*asin(sqrt(pow(sin(
(lat1*pi()/180-lat2*pi()/180)/2),2)+cos(lat1*pi()/180)*cos(lat2*pi()/180)*
pow(sin( (lng1*pi()/180-lng2*pi()/180)/2),2)))*1000)

例如:
SELECT store_id,lng,lat,
ROUND(6378.138*2*ASIN(SQRT(POW(SIN((22.299439*PI()/180-lat*PI()/180)/2),2)+COS(22.299439*PI()/180)*COS(lat*PI()/180)*POW(SIN((114.173881*PI()/180-lng*PI()/180)/2),2)))*1000)
AS
juli
FROM store_info
ORDER BY juli DESC
LIMIT 316
 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved