現代社會講求公平,也把公平視為普世價值。雖然「公平」是一個我們應該爭取的目標,但它顯然不是社會的現實。
由出生開始,人生就是不公平的。我們無法選擇自己的父母,成長的地方和時代。而且這些不可控的環境因素對我們日後的人生都有着巨大的影響。明白事理的父母,穩定的家庭經濟,和因而產生的良好教育和成長環境,能讓我們有更大的發展空間。年幼時的朋輩壓力,和周遭親友的事業成就,也影響我們的自我期許,以及我們對「平凡」的量度界線。更不論天生的外表樣貌等等,會對人生的走向有多大的影響。
雖然我們可以埋怨人生的不公,甚至有時以此作手段爭取權益能帶來一些好處。但終究大環境我們沒有辦法可以控制,怨天尤人也無補於事。世上有兩類人會很強調人生不公這回事。第一類是以此作為自己不努力的藉口,因為既然起跑線遠遠落後於人,努不努力結果也相差無幾,自然放棄也無所謂了。第二類是本身得天獨厚,有着各種先天好處的人。如果起跑線決定命運,當然幸運的他們就能輕鬆地領先到終點,自然他們樂意繼續宣揚人生不公這個論調。但對大部份沒有出生在特別優厚的環境,但又未至於要完全放棄的人來說,人生究竟公平還是不公平,只是一個既有的現象,和需要解決的問題。和其他人生種種需要解決的問題一樣,沒有什麼太大不了。
在研究人工智能和決擇的學科中,有一個分支叫 reinforcement learning (RL)。它的目的就是要尋找在各個環境下,如何透過不同試驗的結果去學得最佳的行動策略。在研究中,學者會把把小小的電腦程式放在不同的虛擬環境裏,然後透過不同的策略去從失敗中學習,最終獲得解決問題的最佳方法。reinforcement learning 和真實的人生有很多相似的地方,例如很多時我們無法知道環境的全貌,只能透過不斷嘗試去觀察什麼行為會導致什麼結果。在未知的環境裏,透過以往的觀察和適當的策略去尋求更好的選擇。
RL要解決的問題和真實的人生很類似,它得出來的策略也有很多值得參考的地方。那些用以摸擬的小小電腦程式, 一開始時無法決定自己在什麼環境開始,很多時它們都只是隨機地被放到某個境況之中。但無論一開始的環境是如何不公,那些小程式仍然只會冷靜地執行有效的策略。因為只要某個行動能改善現狀,那總比什麼不做要好。就這樣慢慢地累積微小的進步,然後在某一刻就能走出厄運的深谷,突然海闊天空豁然開朗。
RL的實驗, 就像是把無數的人生選擇都已經試驗過,然後得出在大部份情況下的最優解。當然不幸仍然會發生,也有機會一開始就遇到死胡同,但只要不是遭遇太過災難性的不幸,總是有辦法慢慢走到終點。它有許多有啟發性的策略,例如要保持樂觀,選擇一個能夠給你最好結果的選項;要記着以往的經驗,作為未來的參考,儘量從別人身上學習,避免自己走冤枉路等等。可能許多只是老生常談,但其實也是無數實驗過後得到的可靠結果。一個人的經歷和時間是有限的,世事又有不確定性,即使你按着最佳的策略行動,也不能保證一定就有最佳的結果。我們可以肯定的只是在統計學上,如果按照最佳的策略行動,不斷嘗試之後,成功的機會總會更高。所以與其埋怨人生的種種不公,不如花更多時間去思考最適合現今處境的策略,然後看輕個別事件的得失,用心在過往的經歷中學習,增加下次成功的機會。
再埋怨人生的不公也是無補於事。更重要的是我們有什麼方法能走出這不幸的深淵,和在每個分岔道,如何冷靜有耐性地做出最佳的選擇,就像那些無比堅毅的小小電腦程式一樣。
對啊,到最終我們為人生唯一抗衡的辦法,也不過是重複試錯,然後找一個比較好的路去行就是了
回覆刪除是呀, 人生實在太多不是我們可以控制的事....
刪除