去年三月,我從全職寫作(i.e. 無業)回到「職場」做產品,還厚著臉皮請大家訂閱當時還沒推出的服務,有幸獲得 100 位創世會員支持。一年過去,是時候把碎片拼湊成完整的圖畫,正式向大家介紹 3ook.com(book-dot-com),這個我負責 UX 設計的產品。
3ook.com
第3代電子書店,可讀、可聽、可擁有。滙聚讀者、作者與書店,共同策展、發布與銷售多元書籍及刊物,運用 AI 及 Web3,保育文化,守護歷史。
如果只能限用五十字,以上會是我對 3ook.com 的介紹,但郵報讀者追求深入探索,因此我將話題展開,今期先討論「可讀、可聽」,「運用 AI」的部分。
不是有聲書,而是書有聲
3ook.com 的最大特色,在於不區分文字書和有聲書,讓每本書都可在閱讀與聆聽模式間隨時切換,除非作者選擇關上朗讀功能。
「讀聽合一」這個設定雖然微小,卻根本地改變人跟書籍的互動,讓體驗更合理,也更符合現代生活。以我自身經驗為例,最近完「讀」的五本書,《我城零五》、《時間的試煉》、《浮世薔薇》、《H醫生一千零一夜》、《豆腐媽媽》,都是坐車、走路、行山、躺著時聽的為主,偶爾切換到閱讀模式查看為輔。要不是這樣,我雖然也會想看這幾部作品,但以平日的生活節奏,加上因長期盯著螢幕而疲勞的雙眼,要騰出時間和視力 HP 完成一本書都很難,遑論還有大批出色的作品。
你或許會說,Audible 有聲書已有廿年歷史,聽書不是新鮮事。的確,我也偶爾在 Audible、Kobo 等平台聽有聲書,但聽傳統的有聲書,除非另購文字版,否則就沒法隨時切換到閱讀模式,釐清不認識的生字,欣賞精美的配圖,和查看資訊圖表等。
再說,絕大部分書籍根本沒有聲音版,以 Amazon 為例,文字書上億,旗下 Audible 的有聲書卻只有一兩百萬,覆蓋率不足 2%;Kobo 要好一些,近千萬本書之中,約 5% 提供聲音版,但這也代表遺落了 95% 的書目。不設聲音版,才是電子書的常態。
如果你讀的都是《原子習慣》、《晶片戰爭》等熱門書,那找有聲書問題不大;但若你像我,感興趣的題材相對小眾,尤其熱衷香港書籍,找到聲音版的機會將接近零,畢竟這些作品即使花上總體收入,都未必足夠以傳統方法錄製有聲書。
多得近年生成式 AI 突飛猛進,3ook.com 預先為聲優的聲線取樣,分析聲紋特徵,再以聲音合成產生整份文本,效果已經十分理想,雖然偶爾會有發音不準、停頓不自然等情況,但平心而論,要不是偶有瑕疵,已經到了分不出真人朗讀還是 AI 生成的地步了。
不是自貶,但客觀而言,傳統電子書平台不可能找人朗讀《區塊鏈社會學》、《財富自由主義》,身為小眾作者,希望作品有聲音版,只能自己想辦法。現在上架了 3ook.com,我的六部作品以及撰寫中的《進擊的自由》,終於得以同時提供文字版及聲音版。
設計 3ook.com 是從滿足自己開始,但我相信,面對同樣問題的讀者、作者、文化保育者,大有人在。
以小眾語言,唸小眾作品
除了小眾作品,小眾的語言,同樣產生不了足夠的商業規模。
是否願意接受都好,粵語已經變得越來越小眾,我對熱愛粵語,以我們的母語朗讀香港書的 podcaster 懷有無比敬意,但我們沒法否認,對於大部分作品,粵語有聲書的市場規模不足以支撐朗讀成本。然而有了語音生成技術,問題就有望得到解決。
3ook.com 現時提供三位預設聲優,分別是旅遊達人薯伯伯、我的兩位拍檔 Phoebe 和 Aurora,前兩者唸粵語,Aurora 唸國語。坦白說,相對於國語,粵語朗讀的瑕疵稍微多一些,但亦已遠超合格的水平;考慮到 AI 模型還在快速進步中,配合足夠多的學習數據,粵語朗讀的效果必然會持續進步,修正最後 1% 的誤差。
有點抱歉的是,3ook.com 暫時還沒能提供台語聲優,畢竟我們資源非常有限,如果有台灣讀者能夠支援,我們定當盡快補上。我雖然不諳台語,但深信以母語接收訊息的親切感,和保育逐漸被邊緣化的文化那份心情,放諸四海皆準。
除了幾位預設聲優,3ook.com 月初更推出了「私人聲優」功能,讓會員上傳自己或獲授權的聲音,朗讀書架上的作品。最近幾週,我幾乎每次見到朋友都會 強迫 邀請他們錄音,一分鐘後,馬上用來朗讀,聲音有時候相似得無法分辨,但也有時候效果還不夠理想,團隊正在以各種方法微調,有信心不用太久,就能進一步提高複製聲音的精準度。
不妨想像一下,父母為孩子講故事,至愛為你朗讀小說;那份令人毛管戙(雞皮疙瘩)的感觸,只有當事人才能體會。
我不是天天試用新模型的 AI 大好友,但由始至終履行「人文為體,科技為用」。透過 語音生成技術,3ook.com 目標讓每部作品發聲,以我們的母語,由最親切的聲音朗讀,保育文化,留住感動。
p.s. 闊別 12 年後,孫燕姿上週再次來港開演唱會,我懷著跟妹妹敘舊的心情入場,看到稍微發胖的燕姿精神飽滿,很替這位兩名小孩的媽媽高興。到了點唱環節,燕姿邀請台下的香港人舉手,然後從中挑了一位,結果一開口就是捲舌普通話,是來港聽演唱會的中國人;下一位點唱,情況依然;再來第三位、第四位,全都一樣,不斷提醒我,身處的是「中國香港」。不只是點唱的幾位,「耳測」我的右邊六位、左邊最少三位觀眾,全是大陸人;進場、離場路上聽到的,普通話佔了大多數。越來越小眾的,又豈止粵語而已。


