你被高考分数支配的恐惧,波尔多的庄主们也体验过


内容深度:★★★☆☆

The numerical ratings are utilized only to enhance and complement the thorough tasting notes, which are my primary means of communicating my judgments to you. 

——Robert Paker

我们把 Robert Paker(罗伯特·帕克)、James Halliday 以及 James Suckling 称为葡萄酒评论家(Wine Critics)而不是评分家 (Wine Raters),但他们的工作常常被我们以一个个数字来概括。

葡萄酒评分的用途,主要是两方面。一是葡萄酒业内,在各种葡萄酒大赛和质量评测、盲品活动中,作为比较的标准;另一个影响更大的作用是,在流行媒体中为消费者提供消费指导。对于消费者而言,「评分」的好处是显而易见的,他在晦涩难懂的专业术语、纷繁复杂的品酒笔记之外提供了一个简单直观的方式,使得葡萄酒的质量得以直接地呈现。来自公允的第三方的质量背书,可以通过一种高效的方式触达消费者,评分给给了酒庄一个强调自己产品质量的有力工具,也使得葡萄酒生产者更加关注其产品质量。

罗伯特·帕克

图片来源:wineinvestment.com

Château Léoville Poyferré 2009 年份的期酒定价是 60 欧元,而在确认获得罗伯特帕克的满分评价之后,其价格应声上涨到了 175 欧元。这是一个评分影响葡萄酒价格的例子,而酒评人的偏好也会进一步影响酒庄、产区甚至全世界葡萄酒生产的风格和市场潮流。除了受罗伯特帕克口味影响所产生的橡木风味浓重、酒精度较高、酒体强劲浓郁葡萄酒的全球风潮之外,另一个例子是 James Suckling 挖掘和推动意大利的叛逆者「超级托斯卡纳」葡萄酒的功绩。

我能够查证到的最早的公开的葡萄酒评分制度,是法国杂志 La Revue du vin de France (RVF)在 1929 年开始使用的 20 分制评分体系。而在美国禁酒令解除之后的 1935 年左右,加州的葡萄酒和食品科学家 William Cruess 提出了使用百分制来评价葡萄酒,并为干红、干白和甜白葡萄酒分别制定了评分规则。不过 William Cruess 的体系并未得到充分使用,现在 UC Davis (加州大学戴维斯分校)使用的是 1959 年由 Maynard Amerine 建立的 20 分制评分体系。

巴黎评判的最后得分

可以说,在 1978 年罗伯特帕克与朋友一起建立 The Baltimore-Washington Wine Advocate   (即后来的 Wine Advocate)之前,葡萄酒评分的制度主要都采用欧洲人确立的 20 分制。著名的 1976 年巴黎评判(Judgment of Paris),使用的正是 20 分制。而在 1978 年之后,各种专业杂志纷纷建立起了形式上是”100 分制”的评价体系。

之所以说是「形式上」,是因为在各家的评分制度中,都有一部分默认的「基础分」。实际上,Wine Advocate 和  Wine Spectator 使用的是 50~100 分; Stephen Tanzer 的网站 International Wine Cellar 使用的是 70~100 分; Wine Enthusiast  和 Wine & Spirits 使用的是 80~100 分。

20 分制与 100 分制的优劣一直是个值得讨论的话题,但我看来差异并没有那么多。100 分制更加简单易懂,符合大众的日常经验。但由于分数划分过于细致,清楚和稳定地将接近的分数之间的质量差异体现出来是很难的。人们很难搞清楚一款 89 分的酒比另一款 88 分的好在哪里,而酒评家们也可能把上次得了 86 分的酒下次给到 88 分。很多人理解百分制的评分是按「分数段」来的,86~88 分是一档,而跨过 90 分的门槛到 93 分又是另一档。再考虑「基础分」的设置,100 分制与 20 分制的差别到底有多大呢?20 分制是一种古典的评分方式,他能够提供比较明确的等级区分,简洁清晰,也是我比较喜欢的方式。

Vivino 的五星评价制度

还有一种更加简单粗略的形式——评星制。评星的方式更加简单直观,当然也更加粗略。当代的葡萄酒评星制度有两种,一种像是豆瓣对书影音或者大众点评对餐馆的五星制评分,一星是严重的差评。那些互联网上的大众评价分制度喜欢用5星制,比如 APP Vivino.Decanter 也曾经使用过五星制,但他们从不会公布那些获得 1 星或者 2 星的葡萄酒名录。而另一种评星制更类似于米其林的餐厅评价——意思是说,能够获得星星本就是一种褒奖。最著名的例子可能是意大利的大红虾,虽然他们实际用的是酒杯而不是星星。

这里有一张来自 Delongwine.com 的不同评分制度转换表,可以帮助你更清晰地认识各种不同的制度。

就像高考分数不能充分展示一名学生的素质全貌一样,评分制度所面临的最大非议是其将一个复杂的、多维度的而且非常主观性的事物强行一维化。虽然罗伯特帕克在其网站上说过「评分的数字只是品酒笔记的补充和增强」,但分数的实际影响力远不止于「补充和增强」的地位。

很多时候,人们在媒体和酒商处能见到的只有一个数字,相应的品酒笔记被忽略,难以全面展示酒款的个性特征。不同类型、产区、品种、风格的葡萄酒放到同一个标准下生硬比较,既有失公平也常常显得滑稽。

图片来源:greeceandgrapes.com

第二个问题在于,葡萄酒的评分标准在不同的机构并不统一,又是一个非常主观化的行为。这使得不同机构的评分标准之间常存在差异,并带着酒评人的个人喜好。一款酒在不同的评分者笔下常常会获得不同的分数,这会给消费者的选择带来相当大的困惑。一个著名的例子是 2004 年罗伯特帕克与简西斯罗宾逊对 Chateau Pavie 2003 的争议。罗宾逊在她的个人网站上称这是一款“荒谬可笑(Ridiculous)”的酒,给出的分数是 12/20。

Completely unappetising overripe aromas. Why? Porty sweet. Port is best from the Douro not St.Emilion. Ridiculous wine more reminiscent of a late-harvest Zinfandel than a red Bordeaux with its unappetising green notes.

——罗宾逊对 Chateau Pavie 2003 的品鉴笔记

而罗伯特帕克一直很欣赏 Pavie 酒庄的酒,2003 年份给出了 96 分的高分。(2004 年评分。其后有多次重新评价,两次给出过 99/100)。针对罗宾逊的批评,帕克认为这是出于对酒庄老板的 Perse 的个人成见。双方唇枪舌剑,各不相让,各大评分机构也多少卷入其中。大部分评分者站到了帕克一边,Decanter 给出了 4 星的评价,Wine Spectator 则给出了 95-100/100 的分数,当时仍供职于 WS 的 James Suckling 表示「got to like this」。

其实简西斯罗宾逊与罗伯特帕克的口味差异一直很显著,Vox 发表的一篇评论文章显示,两者对于 433 款加州葡萄酒的评分的斯皮尔曼秩相关系数只有 0.208。

而对于同一名酒评人,评分的标准也很难保持一致稳定,它会受到品饮者的身体和心理状态、品酒时的环境等各种因素的影响,酒评人会通过多次重复试酒的方式来尽量避免这些影响,但有时候完全稳定依然是不可能的。另外,考察一名酒评家相隔若干年的评分记录,你也常常能看到他口味的变迁趋势。

只有少数的葡萄酒能够获得评判,这也是个问题。著名葡萄酒应用  Vivino 的数据指出,超过 75%的葡萄酒是没有机会获得酒评人的评分的。而在笔者的判断中,这个数字可能会达到 85%。实际上,能够获得评分的葡萄酒只有那些高端葡萄酒、一部分中端葡萄酒和极少数来自大型酒企的基础款葡萄酒;而那些出现在人们餐桌上的日常款葡萄酒,很多是得不到充分有效的评价的。

随着市场的逐渐成熟、全球化贸易和互联网技术带来的多样化、个性化、长尾化消费趋势,集中于某几个葡萄酒评论机构的评分模式已经很难适应大众的需求。一些更加「民主」的众包评分机制开始涌现,其中最著名的有建立于 2003 年的评分网站 CellarTracker.com 和有着优秀酒标扫描识别功能的手机 APP Vivino。 CellarTracker 目前已经有十余万用户的近六百万则评价记录,收录的葡萄酒则有 220 万款。可做对比的是,Wine Spectator 一年的评分数量是 16000 款左右。

很多专业的酒评人表达了对于大众化评分制度的不屑,他们认为普通大众没有能力来判断一款葡萄酒的质量。2012 年,在 Wine Spectator 网站的一篇专栏文章中,酒评人  Matt Kramer 将大众的意见称为“有害的幻想(pernicious delusion)”;而在另一名酒评人 Steve Body 2014 年发表的文章  Crowd-Sourced Ratings and Why They Suck 则指出,“那些网站的读者和用户几乎总是会成为个人口味和潮流趋势的奴隶”,难以保持公平公正。

然而 Vox.com 的一项简单的数据研究,却驳斥了这种说法。Vox.com 抓取了 CellarTracker.com(以下简称 CT) 与 Wine Advocate(WA)、JancisRobinson.com(JR)、International Wine Cellar (IWC)三家由酒评人建立的网站中加州葡萄酒的评分数据,在匹配后两两算出其其评分的斯皮尔曼秩相关系数,得出的结果相当有趣。

如上图所示,CT 评分与 WA、IWC 三者两两呈现了大致相当的相关性,斯皮尔曼秩相关系数在 0.56 左右;而 CT 评分与 JR 的相关性稍弱,为 0.424。最有趣的在于,JR 与另外两家专业评分的斯皮尔曼秩相关系数低到只有 0.2 多一点。综合来看,CellarTracker.com 的评分实际上处于一个较为中庸平衡的状态上,反而是酒评家之间的分歧会更大。这其实很容易理解,酒评人的评价标准本质上是对人们消费品味的提炼总结,酒评人的打分还是会与大众保持一定的一致性。而众包评价网站较大的用户基数,可以使得最终的分数中个人偏好的影响被稀释和抵消。

Wine-lister.com 对于自己评分模型的介绍

通过更多的数据来消弭个人偏好的影响,这样的思路对于那些酒评家的评分同样适用。通过抓取不同酒评家的分数,建立计算模型获得一个新的综合性分数,我们可以把这种评分机制称为「元评分(Meta Rating)」。我个人常用的 Wine-Searcher.com 评分就是一个例子,另外还有综合了二十余家评分的globalwinescore.com,以及把酒评家评分、Wine-Searcher.com搜索数据以及 Wine Owners 等网站的成交数据都纳入计算模型的 1000 分制评分网站 Wine-lister.com。

如果你只是一个偶尔买酒的普通消费者,其实简单看看任何一个评分机构的分数都够用了,但是如果消费的频率更高,希望对葡萄酒的世界有更深入和全面的了解,买到更多好喝的酒,评分确实是一个值得好好研究的工具。

Wine Advocate 评分的分值分配

不同的评分,有着不同的设计思路和侧重,不可避免的会更加看重一款酒的某些方面,而轻视甚至放弃另外一些方面。在我们使用的时候需要搞清楚,这个评分系统包含哪些评价要素,每部分的分值如何,以及不同分档的分数代表什么质量水平。

Wine Advocate 评分的分档

对于一个评分者而言,有(稳定的)偏好并不是一个太大的问题,只要读者能够了解他的这种偏好,并按自己的喜好来进行修正即可。

另一个需要注意的是不同人有更加了解和擅长的产区。罗伯特帕克对波尔多产区非常了解,但他对于勃艮第的评分几乎毫无影响力。勃艮第是属于 Allen Meadows 和 Stephen Tanzer  的地盘。而到了意大利,则是 Antonio Galloni 和 James Suckling 的评分更值得关注。

不要忽略与评分相对应的品酒笔记。每个人都有自己的喜好,即便是满分酒也很难获得所有人的喜好。我的女朋友对青椒味完全接受不能,她就很难认为一款 93 分略带青椒味的赤霞珠会好过 90 分的 Barolo。世间确实有喝酒只为了积累分数作为谈资的人,但我相信有独立品位的你一定不是。所以,还是记得看看酒评家们的笔记吧。

当然,评分终究只是一个工具,使用评分的一个终极方式可以说是适时地忘掉评分。毕竟,你购买和打开一支葡萄酒是为了享受的,把更多的注意力放到酒的感官体验才是正经事,跟随你的唇舌与内心就够了。

参考阅读:

[1] Schatzker, M. and Bazinet, R. (2016). Why amateur wine scores are every bit as good as professionals’. [online] Vox. Available at: https://www.vox.com/2016/12/15/13892364/amateur-wine-scores-critics [Accessed 12 Dec. 2017].

[2] Styles, O. (2004). Parker and Robinson in war of words – Decanter. [online] Decanter. Available at: http://www.decanter.com/wine-news/parker-and-robinson-in-war-of-words-102172/ [Accessed 12 Dec. 2017].

您的赞赏将归属于作者 小程序服务商收取 1%服务费



作者 / 编辑:峄峰

©版权所有 转载请联系 Jonathan@sexydrinkers.com

点击阅读原文搜索查看往期推送内容

本文首发于微信公众号「 小酌日历 」(ID:SexyDrinkers)

发表评论

电子邮件地址不会被公开。 必填项已用*标注