正常,还是不正常
文章来源: 平等性2023-09-22 05:52:55

昨天在热点上看到了网友牧爷的一篇博文,蹭一下BeijingGirl的流量。这篇博文的观点如何,见仁见智,相信每一个网友都有自己的判断,我不加评判,而且那也不是我写这篇文章的重点。那什么是重点呢?一般来说,我在文学城上读网友的博文,除了正文之外,也经常会看看文章后面的留言。我发现,很多的真知灼见,就在这些留言里面。比如说,这篇文章的后面有一则留言,就非常有趣,贴出来和大家分享一下。

在这段留言里面,wendyfei网友谈到了三个层面的问题。第一个层面是夸奖京妞网友事业有成,家庭幸福,人又漂亮,大气,而且她的文章写的好,题材广泛,大家喜欢看。这一点虽然完全是来自wendyfei网友自己的主观判断,但这是他(她)做为一个文学城网友应有的权利,无可厚非;不仅如此,我觉得这样的自由言论是值得尊重的。我看到有网友质疑wendyfei网友可能并没有亲眼见过京妞网友,我自己觉得那并不是根本性的问题。我觉得像这种个人的主观看法,不管是出于留言者本人的想象,还是照镜子看到的,抑或是一种美好的憧憬,那都是个人的基本权利,是受法律保护的。当然,网友的质疑,同样是个人的基本权利,也是受法律保护的。

第二个层面承接了前面的第一点,wendyfei网友讲到,正是因为京妞网友靓丽大气,文采飞扬,所以招到了有些人的嫉妒,并且造谣诽谤人家。对于这一点,我有些不同的看法。虽然我并没有像wendyfei网友那样,见过京妞网友的真颜,不过呢,窈窕淑女,君子好逑,对美好的人和事物,我想我们一般人的反应,都是会想方设法地去亲近,而不是去嫉妒和诽谤。而且我们来文学城玩儿,绝大多数网友的目的就是为了以文会友,如果有一个人的文章写得精彩,题材广泛,见地深刻,大家高兴都来不及。就拿我自己的亲身经历来说吧,我来文学城有三四年了,这期间有幸参加过几次征文竞猜活动。就我所见,大家对于优秀耐读的文章,都是爱不释手,交口称赞。如果因为一个人的文章写得好,就反其道而行之,去造谣诽谤,这一点在道理上怎么也说不通呀。而且,在质疑京妞的众多网友里面,有一些根本就没有开博客写博文,那么指责这些网友是出于嫉妒,又有何根据呢?当然,文学城也出现过这样的情况,有个别网友所写的文章,毫无人性,与普世价值完全逆向而行,很多网友出于义愤,发声呐喊,谴责批驳。不过,这种情况,那和所谓的造谣诽谤,完全沾不上一点边呀。

当然,以上只是我个人的一家之言,很可能会有偏颇。我今天写这篇文章,其实并不是因为上面两点。我主要是对wendyfei网友所阐述的第三个层面颇感好奇。wendyfei网友说:“其实城里的大多人心知明度,明辨是非,只是沉莫不语,但都在支持京妞,这就是为什么京妞常居榜首的原因之一。”我所好奇的是,既然城里的大多网友沉默不语,wendyfei网友是怎么知道他们的想法,并且知道他们都在支持京妞呢?当然,我不能排除有一种可能,那就是wendyfei网友有着超能力,能够洞察我们每一个人的心。

wendyfei网友的留言,让我想到了一个有趣的问题,那就是在文学城,到底是不是大多数的网友在支持京妞,以至于她常居榜首?我虽然没有wendyfei网友的透视眼,不过,我觉得要回答这个问题,还是有可能的。我自己搞了一辈子科学,不太相信特异功能,我最看重的是实证。我觉得要回答这样的问题,可以考虑将其简化为一个数学模型。我们可以假设文学城的网友,有一定比例的人支持京妞,并假设这个比例是P。如果P大于0.5,那么,我们就可以下结论说,文学城大多数的网友都支持京妞;如果P小于或等于0.5,那么,wendyfei网友的结论自然就不成立了。

问题是,怎么样才能知道P的数值呢?有一个办法,那就是给文学城的每位网友发调查表,然后统计出总的支持率。不过呢,这需要发几万份甚至几十位万份表格,不太现实。还有一个办法,也是现在运用得最广泛的,统计推断。这里需要先介绍一个概念,那就是取样(sampling)。取样就是在大样本人群中随机地抽取其中的一部份,然后通过对这个抽样人群的统计计算,来推断出我们所感兴趣的P值。

具体的操作是这样的。假设我们在文学城随机调查100个网友,其中60个支持京妞,那么对于这个抽样人群,它的统计估值(p)就是0.60。这里要注意的是,因为取样的随机性,这个统计估值会有一定的变异性(variation)。因此,我们在推断我们所感兴趣的P值的时候,还需要考虑这个变异性。p 的变异性,一般是用standard error (SE) 来计算,具体可以用到以下的公式:

这个公式里的 n,就是取样的样本,在我们的例子里是100。有了 pn,我们就可以通过计算得到 SE = 0.049。然后还可以得到95%置信区间(95% Confidence Interval),具体公式如下:

95%置信区间 = (p - 1.96 x SE, p + 1.96 x SE)

如果用到我们所讲的例子里,95%置信区间就是(0.504,0.696)。也就是说我们所感兴趣的支持率 P,有95%的可能是落在这个区间里。也就是说,在这个例子里,实际的支持京妞的比率,有大概率是超过50%的。

我们再举个类似的例子。如果用同样实验设定,我们随机取样400个网友,而其中120个支持京妞,那么,p = 0.30, SE = 0.023,95%置信区间就是(0.255,0.345)。也就是说,在这个不同的例子里,实际支持京妞的比率,有极大的概率是小于50%的。

好了,我现在就准备做这样一个实验。希望读了我这篇文章的网友,

如果您是支持京妞网友的,觉得她常居榜首是正常的,请留言:正常

如果您是不支持京妞网友的,觉得她常居榜首是不正常的,请留言:不正常

当然咯,如果您能够多分享一下您觉得正常或是不正常的理由,那就更好了,毕竟上网来玩儿,我觉得大家相互的交流和分享是更重要的,也是更有趣的。对于那些对此不太了解或是不方便表态的网友,我也希望您能谈谈自己的感想和看法。

我的计划是,等三天以后,当有了足够多的网友回复之后,我们任何一个网友都可以根据上面所描述的数学方法,计算 p 值以及它的95%置信区间,进而推断出文学城实际支持京妞的比率。这样的话,不用去劳烦wendyfei网友的特异功能,我们也可以知道文学城大多数网友的心意。

怎么样,简单易行,公平公正,老少皆宜吧?更重要的是,不用吵,不用闹,谁都可以自由地表达自己的那一份观点,还不会伤了和气 鬼脸

这里需要说明一下,每一个实验都有其局限性,具体到这个实验,也不例外。首先,有个别网友可能会有多个ID。我觉得这一点不是啥大问题,以己推人,我相信绝大多数的网友都是诚实的;而且我们这也不是评党代表或是选先进,还需要去弄虚作假。其次,取样的随机性。这一点不太容易,我扪心自问,本人还算得上公允,在我博客里留过言的数千位网友中,支持我的,反对我的,持各种观点的都有,除去那极少数蓄意攻击和侮辱网友的留言,我是不会删贴的。我来文学城有好几年了,相信这一点大家都看到了。除此之外,因为是我自己设计的实验,为了避免有conflict of interest,所以我本人是不会参与的,我也尽量不去影响各位网友自己的判断。做为一个多年从事科学研究的人,我只是希望能够尽量接近随机取样的原则。再就是样本量。样本量的大小,会直接影响置信区间的大小。我很希望大家踊跃参与,如果能有接近200个网友的留言,那么这样的统计推断,就会更加精确,也更有说服力。对啦,最后还有一点,我的博客现在没有列任何黑名单,文学城的每一位网友,同意我观点的,不同意我观点的,都可以来参与哦。

一句话,周末到了,希望给大家找个乐子,也给文学城带点流量。

祝各位周末愉快!

哈哈

(本文图片来自网络)

 

*****************************************************************

投票的结果:

三天的期限到了,我仔细核对了投票的结果,一共有68位网友投票,66票“不正常”,2票“正常”。根据投票数据,计算结果如下:

p = 2.94%,SE = 0.0205, 95%置信区间 =(0, 6.96%)。

这就是说,选择“正常”的比率极低,还不到5%。

谢谢各位的投票和支持。