Wikipedia talk:统计
维基百科,自由的百科全书
我有興趣知道我們中文Wikipedia一天所有頁面的瀏覽次數的總和,有辦法嗎? --Lorenzarius
- 特殊:Statistics有统计,别的办法只有人工统计了,除非用机器人,可是我不会--Shizhao 2003年7月21日 05:36 (UTC)
建议把条目计数改革前和后的条目数量图表分开,现在那个好象有点奇怪。 --Lorenzarius 2003年8月1日 09:06 (UTC)
这是一个对数图--Shizhao 2003年8月1日 10:52 (UTC)
我知道是对数图:-)我所指的奇怪是这样把用不同计数方法的条目数量互相比较好象不太恰当。 --Lorenzarius 2003年8月1日 11:27 (UTC)
现在的统计数据太少,等到统计数据多了以后,我会把它们分开的--Shizhao 2003年8月1日 11:42 (UTC)
- I have added a link to the new statistics page. If you would like a Chinese version that can be done. See also Statistics for all Wikipedias Erik Zachte
目录 |
[编辑] 一些统计数据的分析
移动自Wikipedia:聊天
我根据自动生成的统计数据,制作了一些图表。这些图表有一个特点,就是每种语言的时间坐标的起点是各自的创建时间,这样就能让我们比较处于不同发展阶段的各语言维基的统计数据了。比如,中文现在小,并不是因为它发展的慢,而是因为它起步晚。--Mountain(Talk) 16:52 2005年5月7日 (UTC)
从上面几张图可以看出:英文和日文位于第一梯队,德文是第二梯队,法文和中文是第三梯队;长期的发展趋势,中文有超越法文的潜力。
站内链接和站外链接的统计数据也符合上面的结论。有趣的是日文和中文的跨语言链接显著的高于其他语言,这是为什么呢?我们讨论后,认为可能有两个原因:
- 日文和中文的使用者重视学习西方文化。
- 日文和中文维基创建的晚,这样其他语言可供链接的条目就多。
- 每条条目编辑次数也是日文和中文的高,这是为什么?
- 每条条目平均字节数,日文和中文的相对高一点并不奇怪,因为在UTF-8编码下,日文和中文的字符要占3个字节,而欧洲文字一般只要1、2个字节。但是,意大利语为什么还挺高呢?
有些现象很有趣,大家可以讨论。--Mountain(Talk) 16:52 2005年5月7日 (UTC)
- “每条条目编辑次数也是日文和中文的高”,一个原因可能是有大量的边缘编辑者,常对条目进行小修改。说明中文和日文wiki还大有潜力可挖。另一个可能的原因,至少对中文来说,很可能是编辑战。--Louer 17:30 2005年5月7日 (UTC)
- 第一个原因的话,其实每种语言的用户都应该是正态分布,不是中文的特征。第二个原因,呵呵,编辑战虽然存在,恐怕占的比例也没有那么大。我倒是觉得,中文的编辑次数高,其实是因为“英文德文”的编辑次数低。而它们之所以低,是因为很多条目都采用了现成的资料而绝少改动,中文的资料多半还是手工编制,不仅速度慢,而且准确度不高,所以不断需要编辑。不知道这个分析有无道理?如果中文的数据资料类条目增加的话,恐怕平均编辑次数也会降低的。--Hamham 18:06 2005年5月7日 (UTC)
- “意大利语为什么还挺高呢”个人认为是和语言特点有关吧比如[[Categoria:xxxx]]就比Category每次多一个字节,然后点了几次随机还有特地点了传记那部分,发现一个特点,人名相对长一些:P。上面主要是瞎说。接下来才是实质,他们有用到模板的地方好像里面都是<!-- -->特别是那些地方志的,条目本身只有一句话的小条目,而模板却很详细,而且里面的注释和html代码却占了至少1/3字节!参看it:Brindisi Montagna,it:Terranova dei Passerini,而在分类it:Categoria:Comuni italiani下的,美国类似的小镇连模版或表格都没有,共有8102个条目,估计应该每个都是同样的模版,不知统计时是否包含stub?--这个人很懒,什么也没留下:D 18:23 2005年5月7日 (UTC)
-
- 感謝大山兄的圖解,用這個方法比較各語版的發展的確看得出一些有趣的事物。不過,當我們從其中看出了一些信心時也別忘了,中文版因為起步慢,理論上我們擁有更多來自其他語版的資源可以參考(例如大家常常可以把英、日語版的資料逐文翻譯當作翻譯練習),理應擁有比其他早期建立的語版發展得更迅速的潛力。看看目前的趨勢還看不出這特性,意思是說我們應該表現得比目前更好才對,大家要繼續加油呀!
- 至於單頁平均編輯次數偏多的特性,我認為大家不要忽略早期因為簡繁體差異所造成的反覆編修,還有現在為了簡繁體轉換正常,我們經常得事後修改語言轉換標籤的狀況,這部份的修編動作應該是其他語版罕見的。--泅水大象 訐譙☎ 03:09 2005年5月9日 (UTC)
[编辑] 一个现象
日期 | 意大利语 | it-zh差距 | 中文维基 | zh-no差距 | 挪威语 |
---|---|---|---|---|---|
6.03 | 46314 | 16279 | 30035 | 3212 | 26823 |
6.09 | 46883 | 16471 | 30412 | 2917 | 27495 |
6.13 | 47467 | 16715 | 30752 | 2815 | 27937 |
6.24 | 48849 | 17048 | 31801 | 2845 | 28956 |
7.04 | 50111 | 17293 | 32818 | 3276 | 29542 |
7.11 | 51007 | 17470 | 33537 | 3527 | 30010 |
7.13 | 51382 | 17558 | 33824 | 3669 | 30155 |
7.18 | 52143 | 17892 | 34251 | 3765 | 30486 |
与前后两个语言版本的距离都在加大。--221.11.45.107 04:49 2005年7月19日 (UTC)
大陆的人都上不来,编辑的人少了,当然条目数会和前者拉开.
==条目增长缓慢== 移动自Wikipedia:互助客栈/消息
近几天来好像大家都放假一样,条目数目一直都在50100上下徘徊,是不是冲5万的后遗症啊? 金翅大鹏鸟(talk) 14:21 2005年12月17日 (UTC)
- 冲5万沖得太狠,要休息一下XD--者尺 Talk 04:43 2005年12月18日 (UTC)
- 其實最近也不差啊,每天新條目也都有破百以上,不知道為什麼一直在徘徊,是不是有些灌水條目在處理中啊?俄語版的機器人這幾天沒再寫條目了,不過和我們差距的確已經不遠了,加油加油--ffaarr (talk) 00:35 2005年12月19日 (UTC)
- 早前我在清理前1000年至前1640年代的數百條年份條目。zzz....很睏 "Press" my name and Wake me up inside 20:00 2005年12月19日 (UTC)
- 其實衝上去和壓回來主要都是年代條目的問題。現在應該回歸正常曲線了。-- polyhedron(古韻) 留言 20:42 2005年12月19日 (UTC)
- 同意,我處理的那批灌水條目剛好完成。現在應該回歸正常了。zzz....很睏 "Press" my name and Wake me up inside 20:44 2005年12月19日 (UTC)
- 我倒是觉得小条目数量太多了,部分重要条目创建了一年多,也没有得到大的改进,始终停留在小条目阶段。这样的状态下去突破60000我也觉得意义不大,反而引发虚幻的数量感。我认为应该首先充实一些重要的条目,每个领域的爱好者可以整理出这么一个重要条目列表出来。“所有百科全书都应该有的条目”这个部分也有必要更加重视。--Fugu 05:28 2005年12月19日 (UTC)
-
- 我觉得有一个不太好的趋势,那就是基本上大家都只关心自己撰写的东东,对于已有的许多小条目都缺乏提升的兴趣,这也是为什么中文维基小条目的比例居高不下的根本原因,有没有什么办法能够鼓励大家进行协作呢?是不是可以考虑可以同时在各个兴趣小组中同时进行质量提升计划呢?金翅大鹏鸟(talk) 10:36 2005年12月20日 (UTC)
- 像香港维基人提升关于香港的条目的做法就比较有效。不过,香港似乎是特例,因为其他地方不会集中了那么多的维基人。现在大部分兴趣小组里的人都不多,缺乏协作人数的基础。如果就总是数量不大的一些人在编辑,在提升,这个计划就不可能实现“人人都能编辑”的好处,顶多是“很多人在编辑”的结果。我在想“人人”至少要多少人呢?一个重要的条目,如果没有五六个以上的人在做大的修改,就不可能有好的结果。人多乱,人少冷,但是人多了至少会比较充实。--Fugu 10:55 2005年12月20日 (UTC)
- 我觉得有一个不太好的趋势,那就是基本上大家都只关心自己撰写的东东,对于已有的许多小条目都缺乏提升的兴趣,这也是为什么中文维基小条目的比例居高不下的根本原因,有没有什么办法能够鼓励大家进行协作呢?是不是可以考虑可以同时在各个兴趣小组中同时进行质量提升计划呢?金翅大鹏鸟(talk) 10:36 2005年12月20日 (UTC)
- 还应该整理出一个“维基百科所缺少的传统百科全书条目”,把大英百科全书、中国大百科全书等中的条目列举出来,供大家参考,也可以知道我们和传统大百科全书的差异---{百無一用是書生}- (☎) 06:13 2005年12月19日 (UTC)
上五萬還不夠,中文維基應該上前十名,不如來個超西班牙、趕葡萄牙怎麼樣?--Wingchi 20:07 2005年12月19日 (UTC)
- “超西趕葡”當然是目標之一。zzz....很睏 "Press" my name and Wake me up inside 20:35 2005:年12月19日 (UTC)
- 中文出版界肯公開版權的,實在少之又少。 (香港政府出的xx便覽是不保留版權的,有興趣者可考慮一下) --Hello World! (✉) 02:53 2005年12月20日 (UTC)
- Sl君的建議我會寫到Wikipedia:香港維基人佈告板那邊去,謝謝提供! -- tonync (talk) 18:19 2005年12月21日 (UTC)
[编辑] 各维基的内部链接是如何统计的?
找了几次,没有发现哪个页面可以统计,难道是bot来做的?还是直接查询数据库呢?
[编辑] 中文版維基要努力了
近日留意了一下統計數字,發現俄語版拋離中文版越來越遠,而挪威版則越追越近呢。各位夥伴,要努力寫多點好條目了。Dracula 21:03 2006年3月25日 (UTC)
- 看來努力鼓勵更多人努力一點,一人一條目,集腋成裘。小為 06:15 2006年6月5日 (UTC)
[编辑] 每月编辑次数最多的条目怎么不更新了?
如题。--活见鬼 21:11 2006年11月16日 (UTC)
[编辑] 条目数量比较的長度
大家是否覺得「条目数量比较」太長?可否節錄重要的部份,在「存檔」內則保留完整的版本。--小為 05:52 2006年11月21日 (UTC)
[编辑] 中文維基的「深度」
from Wikipedia:互助客栈/其他
元維基上的各個語言維基總覽新增了一項Depth(深度)的數值,可大約地估計出條目的質素。計算公式以編輯數和非條目佔所有頁面的比例作出計算,深度較高,條目的質素理應也較高。以下是一些語言的深度: (以下排名只計算一萬條目以上的語言版本,括號為條目數排名)
- 英文(1) 211
- 越南文(45) 124
- 希伯來文(19) 121
- 德文(2) 84
- 中文(12) 68
- 阿拉伯文(34) 59
- 西班牙文(10) 52
- 土耳其文(25)49
- 法文(3) / 日文(5) / 意大利文(7) / 保加利亞文(29) 43
另外以下是一些其他語言版本的數值:
- 波蘭文(4)11
- 俄文(11) 35
- 芬蘭文(13) 33
- 韓文(30)33
- 閩南語(97) 42
- 粵語(107)52
中文的「深度」排名第五,也是頗令人感到意外的。 -- Kevinhksouth (Talk) 11:02 2006年12月4日 (UTC)
- 我觉得这份数据参考作用有限。如果有可能的话,调查各个元位组之间的条目数(如1000-3000,3000-5000,5000-8000,8000-10000,10000-20000,20000-50000,50000以上等)倒反而可能会更真实。事实上中文维基对于特色条目的评选标准不算太松,也有很多的优良条目去竞选特色条目的话也并非无资格。--不中举的秀才(江南贡院) 12:56 2006年12月4日 (UTC)
- 我也有類似想法,不過想到俄語及瑞典語維基等的條目,往往是由所謂bot用某些方法機器式做條目,那麼中文維基即使有很多內容有問題的條目,深度都應是頗高的。參考近期出現在首頁的優良條目,很多都要麼是原創大作,要麼翻譯英文維基(而且不長也不做),這絕對影響了深度。--Xieza 14:10 2006年12月4日 (UTC)
深度不同長度,深度是頁面編輯比率,以現在的情形說,中文維基人的活躍度是很高的,條目關注度亦不低,因此才有這樣的深度。--孔明居士 17:36 2006年12月4日 (UTC)
我在各個語言維基總覽上找了半天,我怎么根本找不到depth啊,我的眼睛怎么了,怎么看不到你们看到的东西啊。--鸟甲 17:45 2006年12月4日 (UTC)
- 根據目前情況,depth在總條目數右旁。--Xieza 17:55 2006年12月4日 (UTC)
- 谢谢,看到了。奇怪,看来我眼睛刚才真的瞎了,或者我见到鬼了。--鸟甲 18:32 2006年12月4日 (UTC)
-
- 位元組的問題就是每種語言同樣位元組的意義不同。(例如羅馬字母一個字母1位元,但西里爾字母就不止,就會被高估)。
-
- 另外,這個深度計算公式我覺得很怪異,後半段的分母和分子的位置好像有誤。(照說應該是總頁面作分母,文章數作分子比較合理,這樣才可以反映每個條目的編輯次數)。除了編輯數以外,每個內部連接可能是比較公平的一個數據,我有根據10月底的數據作了兩種排名:在這(另外還有參與人數統計)即使是這樣算,中文版還是屬於平均內容前幾名的版本。但有一點要注意的是,很多平均編輯稢內部連結在我們後面的版本,不代表它整體素質較差,而是比如、荷語、波語、義語、葡語這些版本,有很多機器人條目拉低了平均,如果去掉這些條目,他們的條目質和量還是都還是相當或高於中文版,它們的社群參與編輯情況其實是比我們還活躍的。(瑞典語、俄語則的確在平均水準還差中文一些)--ffaarr (talk) 04:51 2006年12月5日 (UTC)
-
-
-
- 感謝解說,這樣子我可以了解這公式的意義了。不過這樣的算法的確對條目比較較高的版本比較不利,因為「編輯數」其實是包括非條目的編輯數,所以等於非條目頁面的好處被計算了兩次,中文版會被提高個一、兩名,我覺得是因為用戶頁面比很多版本要多。--ffaarr (talk) 08:06 2006年12月5日 (UTC)
- ffaarr兄,编辑数包括非条目的编辑数,虽然看起来非条目页面的好处被计算了两次,但这两次是有区别的。假设另一种公式,即“编辑数”只包括“条目编辑数”而非“总编辑数”,那就可以看出差别了。根据现有计算方法,只要总编辑数相同,无论其中“条目编辑数”和“非条目编辑数”之间比例为何,“深度”的结果都是一样的(把所有的编辑都看作是为条目作贡献的),而如果只计算“条目编辑数”,那么在总编辑数相同时,“条目编辑数”比例越大,深度就越大,这和“深度”设计的理念正好相反(“深度”倾向于认为,非条目越多,则对条目的配套准备就越多,因此条目深度就越高)。根据现在的公式,非条目编辑次数比例高并不能使深度增加,但也不至于使深度减少,而如果只计算“条目编辑次数”,则会出现深度减少的反效果。--鸟甲 20:11 2006年12月5日 (UTC)
- 感謝解說,這樣子我可以了解這公式的意義了。不過這樣的算法的確對條目比較較高的版本比較不利,因為「編輯數」其實是包括非條目的編輯數,所以等於非條目頁面的好處被計算了兩次,中文版會被提高個一、兩名,我覺得是因為用戶頁面比很多版本要多。--ffaarr (talk) 08:06 2006年12月5日 (UTC)
-
-
-
-
-
-
- 深度只不過係一個容易計算的指標。單憑文章數,全部頁數,編輯次數推出文章深度。比起字數,BYTE數,這個計法較少受語言因素影響。各版本都用同一數據,基本上係一個公平計法,亦都係容易理解之計法。當然要深入分析,就不能單看這三個數決定。HenryLi 13:07 2006年12月5日 (UTC)
-
-
-
很久沒有到法語維基百科逛逛了,想不到它的深度竟大大不如咱們漢語維基百科……--Dr.Tam 10:13 2006年12月5日 (UTC)
- 所谓的中文维基深度,其实就是无聊的编辑战太多了。---- 霜>>φ(◎◎へ)Talk 23:00 2006年12月9日 (UTC)
- 無聊的編輯戰?這個月來已經不算多了。反而宗教、心理學和哲學(尤其是中國哲學)的部分條目的質量問題實在不容忽視(其中以基督宗教的條目的問題最為嚴重……),如果其他維基人再對於這些條目漠不關心的話,漢語維基的深度遲早會下降……--Dr.Tam 07:44 2006年12月10日 (UTC)