用于应用的评级系统,是「赞」和「沉」按钮好,还是五星制度好?

【姜戈的回答(69票)】:

任何一个shopping system都包含两个部分

1.发散部分,通过有限的信息输入,帮助用户发现感兴趣的item或item group

2.收敛部分,在已经确定的group里,通过更细分的评价体系,帮助用户作出决策

这时你会发现,针对不同的售卖品,产品设计出来两部分的轻重是很不同的.

1.大平台的系统发散部分非常重,并且类目繁杂难以做针对性的评价维度,只能在普适的维度上做细,比如评价,销量,价格等等,这些东西很难有助于发散部分(这个任务由搜索/类目导航/推荐来承担),大多数情况下是在收敛阶段帮助用户决定"在一群里边买哪个",淘宝,amazon,app store都属此类.这类平台的评分非常量化,并且出现了"对评分的评分"这种精耕细作不厌其烦的设计. 某种程度上Quora/知乎也归为此类

2.针对某一类目的产品,比如点评,豆瓣书影音,可以做出针对性的评价维度,比如口味,环境,人均消费,服务态度什么的.这时的评价系统可以同时承担发散和收敛的任务,比如我可以专门找"北京环境最上流的驴火",这时评价的UGC在我进入商品详情页之前的探索阶段已经发挥了作用.

3.还有一种更单一的情况,即"只有一种评价标准".通常出现在"只卖一种东西"的平台,比如贷款平台卖的是"低利率",电驴卖的是"种子多",搜索引擎卖的是"点的人多"(这个有优化空间,搜索引擎已经有引入简单的评价体系,比如+1,也有社会化的尝试),这时评价体系已经不是必备的了,是锦上添花

4.其实跟评价体系平行的还有很多其他方法可以帮助用户排除不确定性,增进决策.

几个例子

a)

b)b)

c) 最后说说社会化:c) 最后说说社会化:

之前讨论一个电影的产品,讨论稿是一个跟豆瓣一样的10星评价方案. 我当时这么讲:在SNS上做电影产品的优势是你有social graph.并且很可能更生活化,你能得到身边人的意见,有更多机会能够影响用户的生活决策,甚至决定跟谁一起去看,什么时候,去哪里,这都是豆瓣不好做的.

我给的想法是,评分这种东西直接同步豆瓣/imdb就好了没必要重复做,真正要做的是四个button:"别tm看" ,"下载看", "买碟看", "一定要去买票看不然鄙视你"(后边跟一个向好友推荐去哪个影院的流程) ,哦,可能还有一个"征人同看(这个可以直接@好友)".这些操作都可选择向好友发feed,同时都比那个几星几星更直接影响"我今晚看啥". 有了好友圈作为一种"预收敛",社会化的评价其实可以做的更二元化而非量化.

赶飞机,想到再改

【王思达的回答(86票)】:

二者都有不足的地方。

评分是为了给还没有使用的用户一个参考,所以不应该以评分者的角度来思考这个问题。

单独的5星和“顶踩”并没有本质区别(还包括imdb的10星),只是分级数不同而已。至于“顶”和“踩”带来的选择上的方便,只是对于评分者而言的,对那些对这个应用一无所知(或者任何形式的商品,电影,音乐)的人来说,并没有太大的差别。

AppStore采用的柱状图形式,是在上述方案上的改进,让用户(或者说消费者)多掌握了一些信息。

除了分数之外呢?没有了,再没有任何信息了。想要了解更多,就必须去看评论,这无疑增加了用户选择的成本。

值得一提的是Goodfilms采用的评分方法,分布图式。这是从一维信息向二维信息的升级,用户可以更加直观地得到电影的信息。

这是Inception的评分信息,纵坐标是“可反复观看指数”,横坐标就是大家熟悉的评分。可以看出,越靠近右上角,说明影片的综合质量和受喜爱程度越高。

对比下面的Transformers: Revenge of the Fallen的评分,可以很容易地看出差别(分布在右上角的分数很稀疏,说明用户对它的综合评价一般),而不仅仅是分数的不同。

这种二维的评分方法很值得借鉴,既直观又有更丰富的信息。对于app来说,是不是可以用“每周打开次数”这样的指标来代替Goodfilms的“可反复观看指数”呢?

【张卿?的回答(26票)】:

关键是要先弄清楚这些机制的目的是什么。然后才有评价优劣的标准。

在我看来,这些机制的目的是使得用户更容易的理解其所面对的对象(app),帮助其做出下一步的决策(进一步了解、下载、分享……)。拿app举个例子

  • 要不要了解一下这个app?要不要下载这个app?
    • 8.5分,看起来还不错诶
    • 100个喜欢,50个不喜欢...到底怎么样呢?╮(╯_╰)╭
  • 这几个app哪个更好?

    • A 8.5分,B 8分。A了!
    • A 100个喜欢,50个不喜欢,B 50个喜欢,20个不喜欢 O__O"…
  • 如何向别人推荐这个app?

    • 这个app 9分,很不错!
    • 这个app 100个喜欢,50个不喜欢... =_=

这下清楚多了吧XD

感兴趣的话,还可以想想下面这些问题(话说想问题有助于减肥XD):

  1. 为什么更常见的是评星,不是打分(输出都是分数)?

  2. 评星有哪些不足的地方?
  3. 为什么知乎的答案用赞同/反对?

  4. 为什么淘宝的店家信誉不用评出来的星级/分数,而是钻/皇冠?

【杨二毛的回答(26票)】:

感觉大家都在讨论二者的区别,我想从评级本身出发来阐述一下。其实不论是“赞、沉“,或者”五星“,本质都是基于两个维度的质量评级:等级、数量。

只有留在第一区间的产品,才能称得上为精品。而我们看到的排名,无非是等级和数量乘以只有留在第一区间的产品,才能称得上为精品。而我们看到的排名,无非是等级和数量乘以排名系统定义的权重的总和。

这里涉及到三个主要因素:

  1. 等级切分的粒度

  2. 样本数量

  3. 维度的权重
它们的结合,产生了很多有趣的结果和推论。

大家接触到最流行的评级标准应该饭店星级,这个五六十年代的产物影响了无数酒店的兴衰荣辱。这是由一群专业人士基于各种条件进行了相对公平和专业的评价,因此酒店认可,消费者也认可。这里针对粒度提供了5个级别,而样本数量则是专业委员会的全部成员。由于是有限成员数量的机构定义,故权重被淡化, 因此可以看到:在样本有限的情况下,权重被淡化,引入多粒度的等级易于体现各个层次的差异。

可同样是由委员会定义,关于世界国家廉政指数排名,虽然是官方权威发布,但就显得那么的不靠谱。因此可以推导出另外一个结论:在样本有限的情况下,评级单位的诚信度尤为重要。否则纵使你分一百个星星,也没人会相信里面的结果。

在酒店评级之后,音乐评级渐渐流行,其也采用五星制,评分人只有一个:你自己。至今iTunes、Windows Media Player等播放软件仍旧提供此机制。正是由于酒店、音乐针对五星制的流行,因此在社会化的浪潮中,大家也纷纷效仿,这样也最易于被大家接受,但是,时代变了。

如今,不论是大众点评(吃)、虾米(听)、豆瓣(看)、豌豆荚(用)等各类网站,其评分均基于社会化评分机制,因此,好坏的标准主要由样本数量度权重来决定。这个时候,对用户来说,今天是吃一家三星的饭店还是听一首四星的歌曲没有任何意义。因为:

  1. 社会化评级是动态的过程,好的东西终将冒头,何况还有推荐和刷榜机制帮忙
  2. 大部门用户的心态是趋众求好的,一般的东西没多少人注意,倒是烂到渣有可能博取到更多的眼球。
因此,从长远来看,社会化必将推动等级的粒度越来越少。Google的+1 就已经做到了极致。至于未来会怎样,只有等待下一个时代的来临。

【郑进添的回答(6票)】:

很多答案似乎没有看到讨论的前提是应用,而且楼主举的例子是安卓应用,第二种就是鄙荚所采用的方式。

一个手机应用的消费比电影简单容易得多,不过也正是如此,如果手机应用做了什么坏事(比如病毒、推送广告)也很容易让用户讨厌,卸载更是容易,也就是观点容易变得鲜明。

但是五星同样也能表达类似的观点,只不过没有那么对比鲜明而已。这两种都可以用于显示大部分人的观点,其实最重要的是刨除不下载应用就评论的数据,以及 spam 等污染数据,如果评论的分数或者喜欢的数量能够准确反应应用的实情,都可以促进下载(如果评价很差就会抑制下载),也就是真实的观点总是有效的。

【肖琦的回答(5票)】:

看了大家的答案,综合一下,谈谈自己的想法。

不同产品形态适用不同的评级系统。针对题设中应用的评级系统,「赞」和「沉」按钮好。

分评级者和参考者这两个角度来说。

从评级者角度来看,面对不同的对象会有不同的评级标准:

比如对于应用和功能型商品,@郑进添以豌豆荚为例,提到用户选择喜欢或者不喜欢很容易,是不是满足了我的需求,是不是有病毒、广告等令人讨厌的内容等等;

但对于电影、书籍、音乐等意涵丰富、维度多样的商品类型来说,五星制度给了用户更多的选择空间,减少了非黑即白的两难境地,比如这部片子的叙事不清、但是气氛和情绪很棒(对我而言比如王家卫的片子),比如有的片子演员很赞,但是题材和风格不合胃口(比如《天使在美国》)。五星制度就会保留下评价者的这种纠结的微妙。事实上,烂番茄和IMDB就是两个现成的电影评级系统,一个以新鲜度百分比评级,一个是0-10分评级,大家可以自行感受下它们的差异。

从参考者角度来看,参考的其实就是「分」和「人」这两个维度的信息。

虽然两者本质记录的是二维信息,但在多数情况下,都可以被简化为一种单维的指数形式,比如@闫石同学所说的「比例」。但是五星制度记录的「分」这个维度的信息其实是更丰富的,比如一九四二上映初期的非理性评价,如果采用的是赞和沉,可能我们就看不出这种「非理性」。

用户多少的问题。@Fan认为五星有5个层次,会需要更多的人来评价才能较为可靠,赞踩只有2个层次,更少的投票就可以得出较为准确的结果。我觉得没有一定的用户数量做支撑,无论是赞沉还是五星都难说准确、可靠,可以靠其他信息来帮助判断,比如评论、社会化等。用户多少的问题。@Fan认为五星有5个层次,会需要更多的人来评价才能较为可靠,赞踩只有2个层次,更少的投票就可以得出较为准确的结果。我觉得没有一定的用户数量做支撑,无论是赞沉还是五星都难说准确、可靠,可以靠其他信息来帮助判断,比如评论、社会化等。

另一种情况,@姜戈 提到的社会化评价。如果加入社交的话,我们就能放大「人」这个维度的权重,比如一个已确证跟你口味相近的可信赖用户给出的评价,肯定比一个陌生人给出的评价对你更具参考价值。这时,即便采用「赞」和「沉」会弱化「分」这个维度的信息,但因为加入了Social Graph,也能保证影响这套评价系统的有效性,比如Facebook著名的「Like」按钮。

总结一下,如果产品的评级对象为应用或功能型商品,「赞」和「沉」按钮好;如果评级对象是电影、书籍、音乐等意涵丰富、维度多样的商品类型,五星制度更好。除此之外,如果你的评级系统具有社会化背景,那么「赞」和「沉」更好。

【闫石的回答(9票)】:

赞和沉好!

1.从评价者角度讲,选择喜欢或者不喜欢很容易,但是打星级很难!

2.从观察评分做决定的人角度讲。

所谓用户评价系统,决定我们是否下载的是一个比例!而不是星级打分或是赞沉!

理论上讲,不可能有五星应用,也不可能所有用户都喜欢某应用。

不论是五星还是赞沉,最终都成为一个比例。问题中第一个图是9.0星级,第二个图明显是豌豆荚,豌豆荚改版以后也是用的赞和沉,但是做了改进,首先显示的是喜欢某应用的人数比例,鼠标悬浮上面的时候显示喜欢和不喜欢的人数。所以从这个角度讲,星级或者赞沉差不多。

综合以上俩点,首先显示喜欢人数比例的赞和沉更好!

【倪爽的回答(2票)】:

不要空谈原理,要学会用实际的数据解决问题。

方法是:找3个类似的、采用评分制的应用市场,每个网站各抽样200个应用的评分,统计这600个评分中1星、2星……5星的数量,最后看1-5星的正态分布 - 如果分布曲线是两边高、中间低,说明“不管应用市场提供的是5星还是顶、踩,应用市场的用户实际上使用了顶、踩的方式给应用评分”。

【阿杰的回答(0票)】:

这个又不像应试考试,分数能代表一切。

在新用户没玩过的情况下,其它用户的评价是影响下载的首要因素,然后是显示的下载量,比如说问题举例中的这个游戏,虽然得分高,达到9.0,但我依然不会去下载。

为什么?游戏的介绍写的让人没有兴趣,不知道游戏好玩在哪里。看不到用户的评价。下载量只有区区5个,4个喜欢,1个不喜欢,就算系统默认没给评价的那4个人自动给最高的5分,平均9.0的得分看着也很水。

单独比较5分制和一刀切两种机制,5分制其实是更好的,不过要用户自己凭感觉给分就有点难了,不如简单粗暴的一刀切方便省时。

【冉亮的回答(1票)】:

做策略把自己绕进去了,工作之余换换脑。

单一维度的评级,个人更倾向赞、沉设计(或者顶、踩等),评价者操作简单,而受众看到后的思考路径也相对短一些。

多维度的评级,则更倾向打分的设计(星级制度),特别是受众,评价的传递更显直观和真实。受众也许不清楚一个4分的应用是否一定优于5分的应用,但同个应用中,却容易得出某方面更优(更次)的印象。

当然,任何设计都需要结合实际应用的用户群体、场景等来进行,没有一刀切的好坏之分。另外,说下自己在做下载决策时的参考,下载量——评级——评论(无评论的应用,除非为了进行产品体验,否则一律不下)。

【cTrey的回答(1票)】:

提问者在描述里是有前提的“更能促进下载”,因此讨论的核心是哪种哪种评级机制对用户而言更科学,用户会更喜欢。

如果针对这个“产品目标”而言,评级机制的设计中只有评级结果相关。赞沉中“沉的比例”有否定不赞成下载之意,潜意识里引导用户不要下载,而五分制在潜意识里更多是在引导用户,你看大家有多喜欢这个APP,是3星的喜欢还是5星的喜欢。

总的来说,选择哪一种设计,一定是和你的产品设计目标相关,哪有绝对的好坏?!一切要看是否有助于达成你的目标。

【知乎用户的回答(1票)】:

都不好,应该把用户分组。

然后以用户划分为若干群体为对象,分析群体对其的评价。

例如:男生、女生。

--------------------------------------------------------------------------------------------------------

单一取向的数据源和数据展现形式,注定不能真实反映数据要表达的含义。

这是硬伤。

IMDB虽然用了十分制,但是也经常出现一些低分的电影被某个群体所狂热追捧。

虽然我们一直强调做减法,但是有时候,却未必如此。

电影是一个面对所有人的艺术消费品。

游戏很相似,但是经常有女性和男性对同一个对象有截然不同的看法。

回到知乎上,最严重的,持不同知识背景的人,对一个观点的看法简直是水火不容。

单依赖于简单的数据展现模式,很难给用户传递这样的信息。

当然,这可能也不是知乎想要的理念。

如果确实想客观地反映现实的分歧,我的看法是有必要有这样的“高级模式”

【子丹的回答(0票)】:

下载数最好

【宝妮顺顺子的回答(1票)】:

吾非专业人士,缺乏专业人士的专业,我就说说我的直观感受吧

作为用户来讲,更喜欢实实在在的看到这个应用多少人喜欢,多少人不喜欢,不要百分比,只要纯数字,如果喜欢的人很多,可能会下载,如同在淘宝购物选择销量大的商家一样;

如果站在商家角度也就是app的开发者来考虑的话,前期没有绝对优势的时候想要以最模糊的方式让用户来下载,而下载量达到一定量级的时候会希望将自己的优势展示出来,因此不同阶段可以采取不同的评级方式;

这就如同一个世俗人一样,当没钱的时候拼命想让别人认为他有钱,或者买假首饰,假珠宝等满足虚荣心,换取别人的目光,而别人也会买账;当有钱以后,就希望将真真实实的财富展现出来。

最终还是要落脚于商业的本质,让更多用户使用,让用户使用的更多!

【安政的回答(0票)】:

个人认为还是赞沉好。

打分的评判标准因人而异,有些人感觉好就打五分,不爽就一分。有些就很苛刻,所以标准很难统一。

赞沉就制订了一个很好的标准,就政治上的像选举一样,要么赞成要么反对,当然还可以弃权

关键还是看你要做什么,音乐,电影类五星打分就很好。当然,这里的好很可能是一个习惯问题。也可以做成赞沉的形式,这点500px上就做得很好

【徐毅的回答(1票)】:

作为外行,我的感觉是,五星级和“赞”、“顶”(“沉”就算了吧,感觉有贬义)之类的区别,就好像买自行车的五档变速和无级变速一样。。五星级限定了必然是五档,而“赞”则可以分为无数档级,可以有非常细的区分。

而且,在我看来,其实这个评级更多的是“受欢迎程度”,而不是app本身的“专业程度”,就像搞歌唱比赛,也有专业分和听众分的区分。

酒店不是有星级评定机制么(现在也还有7星级、超5星之类的说法呢),但星级是依据其自身的软硬件各方面配置的情况来评定的,跟这个酒店的受欢迎程度和满意程度是两回事。一个酒店可能星级不高,但却非常的受欢迎。一个酒店可能星级很高,但却恶评如潮。都是有可能的。

而app的这个评级,我看用户很少会去区分这两个方面,给出来的评价多数时候更多的是自己对这个app是否喜欢,当然,还不排除投票是否真实这一部分。我觉得吧,就选成“赞”、“顶”就可以了,体现这个app受欢迎的热度。当然也可以同时提供星级评估,不过这个不是用户来评,而是由“业内专业人士”来评选的,而且必须要写得有理有据才行。可以想象,未来查看这些专业评论也会变为一种乐趣的。

【周梦婷的回答(0票)】:

赞 沉 +1

1. 「赞」比「5 分」的相对差距感觉要小的多,觉得应用好的人,可能「好」的要求不同,但只要标了就一定是「好」的。但「1-5 分」明显误差会更大;

2. 说回来刺激下载,一个好应用,100 个人愿意表达观点,100 个人标「赞」;同样,80 个人标「5 星」,20 个人标「4 星」;so...100 20+80

【张水月的回答(0票)】:

我比较关心的是:这2种做法能够为用户和产品提供什么价值。

从单纯的5星和赞沉,我和大部分回答的人共识差不多。以我目前能力还看不出是否有很大的区别。

但案例上面我更喜欢谈谈 淘宝商品的多选的五星评价和糗事百科的赞沉。

淘宝商品可以对服务、物流、商品本身进行多项的评价,这个分数的统计对于用户和淘宝本身的数据收集工作是有帮助的,如果简单的赞沉,则对数据收集和用户参考给不到太多的参考。

反而糗事百科,产品定位很简单,就是多发一些感兴趣的内容。用户的评价标准只要是好笑或者不好笑,好玩还是不好玩,即可。本身糗百内容没有必要对文笔还是排版等细分有要求。

【何嘉的回答(0票)】:

给星需要思考。赞和沉有一个即可。

【涂侃的回答(0票)】:

我觉得应该给出打多少星的多少人。每个人都有自己的打分的原因,也不会因为一种小瑕疵来点

【沉】

评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
新闻聚焦
热门推荐
  • 超模芭儿·莱法利内衣写真曝光 揭其资料介绍

    以好身材知名的著名模特芭儿·莱法利拍摄新内衣写真,露天农场中大秀火辣身段。 以好身材知名的著名模特芭儿·莱法利拍摄新内衣写真,露天农场中大秀火辣身段。 芭儿·莱法利个人资料 芭儿·莱法利,1985年出生于以......

    01-09 来源:未知

    分享
  • 李天一案受害人律师田参军资料简介及照片

    女方辩护律师田参军出庭 【未必孤独网综合报道 www.vbgudu.com】 今日(8月20日)上午九点半,李某某等涉嫌轮奸案在海淀法院召开第二次庭前会议。原告杨某某的律师田参军在庭前接受新浪娱乐专访,他对案件充满信心,......

    01-09 来源:未知

    分享
  • 直击首府扫黄现场 卖淫女真淫荡不堪

    南宁市公安局统一部署,对该市四个城区的游戏机赌博窝点及涉黄场所进行查处行动。在南宁仙葫大道18号金富盈大酒店的休闲会所内,10多名穿着暴露的女子坐在沙发上,逐个接受民警的检查。在酒店内共抓获涉黄人员69人,......

    01-09 来源:未知

    分享
  • 朱丽倩素颜求名医:为刘德华力拼生二胎作准备

    朱丽倩素颜出现。 台湾媒体报道,刘德华(华仔)与“华嫂”朱丽倩6月23日度过5周年结婚纪念,她去年冒著46岁高龄产妇风险生下爱女刘向蕙,女儿已15个月大,让华仔幸福沉浸天伦乐。今年5月传出他想再生1个儿子,47岁......

    01-09 来源:未知

    分享
  • 世界上最柔软的女子拍全裸日历 Zlata资料介绍

    据外媒报道,俄罗斯体操运动员Zlata被称为“世界上最柔软的女子”,近日,她拍摄了2016年日历,上演了一场极端柔术表演。 据外媒报道,俄罗斯体操运动员Zlata被称为“世界上最柔软的女子”,近日,她拍摄了2016年日......

    01-09 来源:未知

    分享
  • 震惊!捐精由护士出手,事实还是谣言?

    近日,网络上盛传一则消息,设在上海仁济医院的上海人类精子库对捐精人员的采精过程竟然由护士出手完成,并且还附有一张照片,在照片上我们看见,一个病房一样的房间里,几张病床并列放在一起,一些捐精者躺在床上,......

    01-09 来源:未知

    分享
  • 堕落!三女子裸聊被抓获 竟提前录播

    小区一个单元内住了三名年轻女子,除了下楼买饭基本上整天“闭门不出”,邻居们觉得事有蹊跷。宝安警方在“虎啸行动”进行清查时发现,这些女子居然衣着暴露地在电脑前聊天,配备了各式绚丽的衣物为对方表演,一查之......

    01-09 来源:未知

    分享
  • 《唐顿庄园》主演米歇尔·道克瑞未婚夫去世

    【未必孤独网综合报道 www.vbgudu.com】据外国媒体报道,《唐顿庄园》“大小姐”演员米歇尔·道克瑞的未婚夫John Dineen去世,据称他是因患上了一种“罕见的癌症”,上周日在家乡爱尔兰去世,才34岁。道克瑞紧急从美......

    01-09 来源:未知

    分享
  • 《喜爱夜蒲3》开机:众女星齐秀事业线博眼球

    2013年8月21日讯,香港,20日,由钱国伟执导的电影《喜爱夜蒲3》受到陈静(Dada)单方面宣布退出事件,剧本方面要重新编写,钱国伟携演员许奕妮、雨桥、林德信、何佩瑜、陈柏宇、郭颖儿、萧美卡和夏尉喻等于泳池边再......

    01-09 来源:未知

    分享
  • 90后女大学生办形体展 称裸体艺术纯洁

    每幅照片背后都有一面镜子,镜子里是其他照片画面,镜面上写着诗句 1991年出生的苏紫紫,是人民大学艺术系二年级女生。前天,在中国人民大学徐悲鸿艺术学院,一场名为《Who am I》的艺术展低调开幕。展览由苏紫紫的......

    01-09 来源:未知

    分享
返回列表