維基百科:機械人/申請/WhitePhosphorus-bot/3
- 狀態: 撤回申請
- 操作者: 碸中嘌呤的白磷萃取 打譜
- 提請時間: 2017年2月10日 (五) 14:11 (UTC)
- 自動化程度:全自動
- 程式語言:Python
- 用途:自動更新條目中的Alexa排名
- 源代碼連結:
- 編輯時段及頻率:每月跑一次,最大15/min
- 受影響頁面:Special:鏈入頁面/Template:Infobox website、Special:鏈入頁面/Template:Infobox dot-com company中的部分條目
- 遵守機械人規範:不相關
- 已有機械人權限:是
- 其他信息:
- 沒在條目做改動,只在沙盒做了編輯展示一下格式:這是差異連結(只列出了信息框),請關注一下
|alexa=
參數和最後效果,格式可以商榷。 - 只有同時檢測到
|url=
(類似偽基百科這種有多條時只跑第一條url)和|alexa=
(防止中文維基百科這種alexa排名完全與維基百科相同的)參數時,才會跑這個條目。 - 支持三種
|url=
參數的格式:{{url|域名}}
、[域名 说明文字]
,這兩種都沒檢測到就直接把整個參數當成域名。如果404了就不更新此條目。 - 用的是alexa的api
http://data.alexa.com/data?cli=10&&url=域名
。404的判斷也是從這裏獲得的。
- 沒在條目做改動,只在沙盒做了編輯展示一下格式:這是差異連結(只列出了信息框),請關注一下
- 以上。 --碸中嘌呤的白磷萃取 打譜 2017年2月10日 (五) 14:11 (UTC)
- 這種應當搬到wikidata,並且到那上面去跑。--Antigng(留言) 2017年2月10日 (五) 14:13 (UTC)
- 不是很了解那裏,之前去那邊的互助客棧問了。 --碸中嘌呤的白磷萃取 打譜 2017年2月10日 (五) 15:51 (UTC)
- 這種應當搬到wikidata,並且到那上面去跑。--Antigng(留言) 2017年2月10日 (五) 14:13 (UTC)
- github不是中國網站,卻來個中國排名,比較奇怪....alexa排名只有wikipedia.org這樣的才有,其下的二級域名都算wikipedia.org的,所以目前的檢測方式似乎可能不太恰當。另,我也覺得應該在wikidata跑--百無一用是書生 (☎) 2017年2月13日 (一) 09:25 (UTC)
- Traffic Rank in Country也是那個接口給的,是按國家排名最靠前的(The site with the highest combination of visitors and pageviews is ranked #1 in that country.)。二級域名的問題,現在如我所述是假設有
|alexa=
參數的都有獨立的alexa排名(即不會自作主張地加入alexa排名,只會更新),所以不會跑那些維基百科的二級域名,暫時沒看到什麼不妥。最後,如果wikidata的alexa排名能很方便地同步到zhwp的信息框(不太懂這個),我很樂意在data上跑。順便,那邊的人說「running the bot once per year is fine to update the Alexa rankings」,因為不刪除舊的數據。 --碸中嘌呤的白磷萃取 打譜 2017年2月13日 (一) 09:40 (UTC)- 國家排名這個數據太詭異,謹慎一點的話,建議先不要,只要全球排名數據比較好。wikidata數據可以通過#property語法來調用,但現在一般都是包裝在lua里來實現--百無一用是書生 (☎) 2017年2月14日 (二) 03:46 (UTC)
- 調用方法是{{#invoke:Wikidata|getValue|P1661|FETCH_WIKIDATA}},效果見Quora。如果要顯示日期要複雜一些,Module:Wikidata不能實現,需要引進d:Module:Wikidata。--GZWDer(留言) 2017年2月14日 (二) 13:54 (UTC)
- 國家排名這個數據太詭異,謹慎一點的話,建議先不要,只要全球排名數據比較好。wikidata數據可以通過#property語法來調用,但現在一般都是包裝在lua里來實現--百無一用是書生 (☎) 2017年2月14日 (二) 03:46 (UTC)
- Traffic Rank in Country也是那個接口給的,是按國家排名最靠前的(The site with the highest combination of visitors and pageviews is ranked #1 in that country.)。二級域名的問題,現在如我所述是假設有
- github不是中國網站,卻來個中國排名,比較奇怪....alexa排名只有wikipedia.org這樣的才有,其下的二級域名都算wikipedia.org的,所以目前的檢測方式似乎可能不太恰當。另,我也覺得應該在wikidata跑--百無一用是書生 (☎) 2017年2月13日 (一) 09:25 (UTC)
感謝各位的幫助。那我就 操作者撤回申請了,有空會考慮寫一個在wikidata運行的機械人。 --碸中嘌呤的白磷萃取 打譜 2017年2月14日 (二) 14:35 (UTC)
- @WhitePhosphorus:建議你先去了解一下wikidata的數據模型,了解一下什麼是Statement、Qualifier、Rank、Reference,以及怎麼表示。--GZWDer(留言) 2017年2月14日 (二) 15:24 (UTC)