A No-Nonsense Introduction to Quantum Theory ตอนที่ 1

แรกๆผมจะต้องกำหนดชื่อกำหนดนิยามให้กับอะไรต่อมิอะไรเยอะหน่อยนะครับ ทนจำหน่อย แลกกับถ้าไม่กำหนดเรื่องพวกนี้ให้เห็นตรงกันตั้งแต่แรกพอมันซับซ้อนขึ้นเรื่อยๆจะทำให้สับสนได้ และถ้าจะอ่านให้ไม่ติดขัดผมคิดว่าควรจะคุ้นเคยกับการคำนวณความน่าจะเป็นกับการคูณเมทริกซ์มาก่อน ถ้าไม่แน่ใจว่ารู้มากพอรึยังก็อ่านบทความไปก่อนก็ได้ครับ ถ้าเจอที่ไม่เข้าใจก็ค่อยกลับมาทบทวนได้

To describe a state of n particles, we need to write down an exponentially long vector of exponentially small numbers, which themselves vary continuously. Moreover, the instant we measure a particle, we “collapse” the vector that describes its state—and not only that, but possibly the state of another particle on the opposite side of the universe. Quick, what theory have I just described?

The answer is classical probability theory.”

Scott Aaronson

เวลาฟังเรื่องควอนตัมคงต้องได้ยินอะไรอย่างฟังก์ชันคลื่น, สมการ Schrödinger, ความไม่แน่นอนของ Heisenberg, การยุบตัว (collapse) ของฟังก์ชันคลื่นเมื่อทำการวัด, entanglement, หรือการเคลื่อนย้ายข้อมูลแบบไร้สัมผัส (teleportation) โดยที่ไม่เห็นความสัมพันธ์ซึ่งกันและกันของคอนเซปต์เหล่านี้ แต่จริงๆแล้วทฤษฎีควอนตัมเหมือนกับทฤษฎีฟิสิกส์ส่วนใหญ่มีกฏพื้นฐานหลักๆเพียงไม่กี่ข้อที่นำไปสู่ “กฎ” อื่นๆในทฤษฎีได้ (จริงๆแล้วถ้ากฎที่เหลือสามารถให้ “กฎพื้นฐาน” กลับมาได้ การจะเรียกกฎไหนว่าพื้นฐานไม่พื้นฐานก็ตามใจเรา ไม่ตายตัว) เนื้อหาของกฎพื้นฐานที่ปกติสอนกันบอกวิธีว่า: เราจะกำหนด “quantum state” ทางคณิตศาสตร์ให้กับระบบฟิสิกส์อย่างไร, จะแปลงมันอย่างไรได้บ้าง, และเมื่อทำการวัดหรือสังเกตจะให้ผลใดออกมาบ้างด้วยความน่าจะเป็นเท่าไร ถ้าเราถามว่าไอ้ quantum state นี่มันบอกอะไรเกี่ยวกับสิ่งที่เกิดขึ้นจริงลึกลงไปกว่าผลการสังเกต ไม่มีคำตอบที่เห็นตรงกัน ดังนั้นผมจึงขอยึดการตีความไปเลยว่าถ้าความน่าจะเป็นทั้งหมดที่เราคำนวณได้มาจาก quantum state นี้แล้ว ในมุมมองหนึ่งมันก็ไม่แตกต่างจากความน่าจะเป็นบนเซตของเหตุการณ์เหมือนที่เราใช้ในทฤษฎีความน่าจะเป็น อาจจะมีเครื่องมือที่เตรียม “ระบบ” (เช่นลูกบอลลูกเดียวหรือหลายลูก) ที่อาจจะมีความไม่แน่นอนตั้งต้นอยู่แล้ว (บอลอาจจะเป็นสีขาวหรือสีดำ) นำมันไปผ่านการแปลง (เช่นโยนไปในรูเล็ต) และเราสังเกตผลลัพธ์ (ช่องที่มีลูกบอลอยู่และสีของลูกบอล) ซึ่งไม่แน่นอน

operationalism

ก่อนจะทำความเข้าใจควอนตัมเราจึงจะมาดูทฤษฎีความน่าจะเป็นกันก่อน ดังที่ quote ของ Scott Aaronson ด้านบนสุดเอ่ยถึง, มีคอนเซปต์บางอย่างที่คนมักคิดว่าเป็นควอนตัมแต่จริงๆแล้วก็มีในทฤษฎีความน่าจะเป็นธรรมดา และผมจะปิดท้ายด้วยการเสนอการเคลื่อนย้ายข้อมูลแบบไร้สัมผัสโดยไม่มีอะไรควอนตัมทั้งสิ้น!

เนื้อหา

ทฤษฎีความน่าจะเป็น
บิท
การผสมความน่าจะเป็น
ระบบคู่
การแปลง
การวัด
การก๊อปปี้
การเคลื่อนย้ายข้อมูลแบบไร้สัมผัส

ทฤษฎีความน่าจะเป็น

ทฤษฎีความน่าจะเป็นเริ่มด้วยการกำหนดเซตของความเป็นไปได้ (possibilities) หรือเหตุการณ์ (events) ที่เราสนใจ และเราจะเรียกเซตนี้ว่าระบบ (system) ใช้เป็นโมเดลประมาณสิ่งที่เกิดขึ้นจริง เช่น เวลาเราทอดลูกเต๋ามี 6 หน้าเราก็ถือว่ามันมีแค่ 6 เหตุการณ์ที่เป็นไปได้ ไม่ได้คิดว่ามันจะบาลานซ์อยุ่บนมุมไม่ยอมออกหน้า, หายเข้าไปในพงหญ้า ฯลฯ แต่ถ้าเราโมเดลแบบหนึ่งแล้วมันอธิบายสิ่งที่เกิดขึ้นจริงได้ไม่ดีพอก็อาจจะต้องเพิ่มเหตุการณ์เข้าไป

จากนั้นเราก็กำหนดความน่าจะเป็นของทุกๆเหตุการณ์หรือ state คำนี้จะคิดว่าย่อมาจาก state of knowledge ก็ได้ คือเป็นตัวแทนความไม่แน่นอนของเรา เป็นความน่าจะเป็นแบบอัตวิสัย (subjective) อย่างไรก็ตามสรุปแล้วในบทความนี้

state = การแจกแจงความน่าจะเป็นบนเซตของเหตุการณ์

โดยความน่าจะเป็นทั้งหมดต้องรวมกันได้ 1

เมื่อเรามี state แล้ว กฎของความน่าจะเป็นที่เรารู้ก็จะเป็นตัวบอกเราว่าเราทำอะไรกับ state ได้บ้าง

บิท

ระบบที่ง่ายที่สุดและมีอะไรน่าสนใจศึกษาคือระบบที่มีสองเหตุการณ์ (ไม่มีอะไรเกิดขึ้นในระบบที่มีเหตุการณ์เดียว) ศัพท์คอมพิวเตอร์จะเรียกระบบสองเหตุการณ์ว่าบิท (bit มาจาก binary digit) ซึ่งมีค่า 0 หรือ 1 (ซึ่งจะกลายเป็น q-บิท (qubit มาจาก quantum bit) ในควอนตัม) จะนึกภาพว่ามาจากคนโยนเหรียญ เขียนบันทึกหน้าที่ออก แล้วก็เอาผลปิดใส่ซองแล้วเอามาให้เราก็ได้

เราเขียน states ทั้งหมดที่เป็นไปได้ของระบบนี้ได้ในรูป \{p,1-p\} หรือเวกเตอร์

\left[\begin{array}{c}p\\1-p\end{array}\right]

โดยที่ p คือความน่าจะเป็นที่บิทมีค่า 0

เราสามารถกำหนดขนาดหรือความยาวของเวกเตอร์ว่าเป็นผลบวกของตัวเลขทั้งหมดในเวกเตอร์ได้ ทำให้ state เป็นเวกเตอร์ยาว 1 หน่วยของจำนวนไม่ติดลบ

การผสมความน่าจะเป็น

ความไม่แน่นอนในหลายขั้นสามารถถูก “ผสม” เข้าด้วยกันได้ เช่น ถ้าเรารู้ว่าผลในซองที่ได้ถ้าไม่มาจากเหรียญที่ไม่ถ่วงก็ต้องมาจากเหรียญที่ถ่วง \{0.6,0.4\} แต่ไม่รู้ว่าเป็นเหรียญไหน เราสามารถเขียนแทนความไม่แน่นอนของเราได้ด้วยการบวกเวกเตอร์ความน่าจะเป็น แต่ต้องระวังไม่ให้ความยาวของเวกเตอร์เปลี่ยนไป เราสามารถจัดการเรื่องนี้ได้โดยการกำหนดไปเลยว่าวิธีเดียวที่เราจะบวกเวกเตอร์ความน่าจะเป็น u กับ v เข้าด้วยกันได้ก็คือ

au+(1-a)v

โดยที่ a เป็นตัวเลขและ 0< a< 1 แปลว่า a และ 1-a ก็เป็นความน่าจะเป็นนั่นเอง(ในตัวอย่างข้างต้นคือความน่าจะเป็นที่จะได้เหรียญใดเหรียญหนึ่ง) ที่”ผสม”ไปกับความไม่แน่นอนใน u และ v States ที่เขียนได้ในรูปนี้โดยที่ u\neq v เราเรียกว่า mixtures หรือ mixed states ตรงกันข้ามกับ pure states ที่ถ้าเขียนในรูปนี้แปลว่า u=v ซึ่งในที่นี้ก็คือ states ที่ไม่มีความไม่แน่นอนเลย: \{1,0\} และ \{0,1\} นั่นเอง  (ถ้าในนิยามการบวกของเวกเตอร์ความน่าจะเป็น เราใช้เครื่องหมายน้อยกว่าหรือเท่ากับแทนเครื่องหมายน้อยกว่า เราจะสามารถเขียน \{1,0\}=1\{1,0\}+0\{p,1-p\} ได้ ทำให้ทุก states เป็น mixtures หมดและไม่มีความหมายที่จะนิยาม mixed และ pure states) การแยกแยะ states เป็น pure และ mixed states จะมีความสำคัญมากเมื่อเราคิดถึงความแตกต่างของทฤษฎีความน่าจะเป็นธรรมดาและแบบควอนตัมในตอนหน้า

State space หรือเซตของ states ที่เป็นไปได้ทั้งหมดของบิทมีรูปร่างเป็นเส้น

state space

รอวาดใหม่ด้วยโปรแกรม

จะเห็นได้่ว่า mixtures อยู่บนเส้นตรงระหว่าง states ที่เอามาผสมกัน ตรงข้ามกับ pure states ที่อยู่ตรงปลายทำให้ไม่สามารถอยู่บนเส้นตรงระหว่างจุดสองจุดใดๆได้

ระบบคู่

ถ้ามีสองบิท เซตของเหตุการณ์ก็จะใหญ่ขึ้นเป็น 2 \times 2=4 คือ  \{00,01,10,11\} (เวลาเขียนเวกเตอร์เราจะเรียงจากบนลงล่างแบบนี้เสมอ เพราะ 00,01,10,11 ในฐานสอง คือ 0,1,2,3 ในฐานสิบ)

miss understandingควอนตัมคอมพิวเตอร์. อาจจะเคยได้ยินว่าควอนตัมคอมพิวเตอร์นั้นทรงพลังกว่าคอมพิวเตอร์ธรรมดาเพราะการจะเขียน quantum state ของ n Q-บิทต้องใช้หน่วยความจำเก็บจำนวนจริงที่มีจำนวนเพิ่มขึ้น (จำนวนของจำนวนจริงนะที่เพิ่มขึ้น ไม่ใช่ค่าของแต่ละจำนวนจริงที่เพิ่มขึ้น) แบบเอกซ์โพเนนเชียลตาม n (แปล: เพ่ิมขึ้นเร็วมากๆๆๆ ดูกราฟด้านล่าง) และย้ำว่าจำนวนจริง ซึ่งถ้าต้องการเก็บด้วยความแม่นยำที่ไม่จำกัดก็ต้องใช้หน่วยความจำที่ไม่จำกัดเหมือนกัน (เพราะจำนวนจริงอาจจะมีทศนิยมไม่รู้จบ) เทียบกับคอมพิวเตอร์ธรรมดาที่หน่วยความจำต้องเก็บแค่เลขฐานสอง n ตัว ต๊อกต๋อยมาก[1]

Screen Shot 2556-10-19 at 7.33.48 PM

การเพิ่มขึ้นแบบเอกซ์โพเนนเชียล

แต่ถ้าเรามี n บิทธรรมดาๆ จำนวนของเหตุการณ์ก็จะเป็น 2^n ดังนั้นการอธิบาย state ก็ต้องเก็บจำนวนจริง 2^n จำนวนในหน่วยความจำ เพิ่มขึ้นแบบเอกซ์โพเนนเชียลเหมือนกัน! คำอธิบายที่มาของพลังของควอนตัมคอมพิวเตอร์ด้านบนใช้ไม่ได้เพราะเขาเปรียบเทียบควอนตัมคอมพิวเตอร์กับคอมพิวเตอร์ธรรมดาแบบที่ไม่ใช้ความน่าจะเป็น ในศัพท์ที่เราได้นิยามกันไปแล้วตอนพูดเรื่อง state space, เขานับแค่หน่วยความจำที่ใช้เจาะจง pure states คือค่าของ n บิทที่เป็นเลขฐานสอง n ตัว

ถ้าสองบิทไม่สัมพันธ์กัน (uncorrelated) ให้ state ของบิทหนึ่งเป็น \{p,1-p\} และ state ของอีกบิทเป็น \{q,1-q\}  state ของระบบคู่ก็จะเป็น

\left[\begin{array}{c}pq\\p(1-q)\\(1-p)q\\(1-p)(1-q)\end{array}\right]

เพราะว่าความน่าจะเป็นของสองเหตุการณ์ที่เป็นอิสระต่อกันเป็นผลคูณของความน่าจะเป็นของสองเหตุการณ์นั้น

ปกติจะเห็นคนเขียนเป็นสมการแบบนี้:

\left[\begin{array}{c}p\\1-p\end{array}\right]\otimes\left[\begin{array}{c}q\\1-q\end{array}\right]=\left[\begin{array}{c}pq\\p(1-q)\\(1-p)q\\(1-p)(1-q)\end{array}\right]

“ผลคูณ” ด้วยเครื่องหมาย \otimes มีชื่อน่ากลัวๆว่าการคูณแบบ Kronecker (หรือฟิสิกส์ชอบเรียกว่าการคูณแบบเทนเซอร์ (tensor product) จริงๆคิดว่าต่างกันหน่อยแต่ไม่สำคัญ) นักเรียนจะขยาดเวลาได้ยินชื่อนี้ครั้งแรกในคณิตศาสตร์หรือฟิสิกส์ควอนตัม แต่หน้าที่ของมันในทฤษฎีความน่าจะเป็นซึ่งเหมือนกับหน้าที่ในทฤษฎีควอนตัมทุกประการก็แค่เพื่อรวมระบบที่ไม่สัมพันธ์กันเข้าด้วยกันอย่างที่เราทำไปแล้วเมื่อกี้โดยไม่ต้องเอ่ยชื่อมันขึ้นมาเลย แต่ต่อจากนี้ไปเราจะใช้ชื่อ tensor product เพื่อความสะดวก

คราวนี้ถ้าเรามี state ของระบบคู่แต่เราเลือกที่จะสนใจแค่ระบบเดี่ยวจะทำอย่างไร? ความน่าจะเป็นของค่าของบิทของเราจะต้องเฉลี่ยจากความน่าจะเป็นของค่าของอีกบิทที่เราไม่ได้สนใจ

p(a)=\sum_{b\in B} p(a|b)p(b)=\sum_{b\in B} p(a,b)

เราจะเรียกการแจกแจงความน่าจะเป็น p(a) นี้ว่า marginal state ถ้าเราหา marginal state ของ state ของระบบคู่ที่ไม่มีความสัมพันธ์กันด้านบนก็จะได้ state ของระบบเดี่ยวกลับมา

แต่ state แบบนี้ก็เป็นไปได้ใน state space ใหม่

\left[\begin{array}{c}0\\ \frac{1}{2}\\ \frac{1}{2}\\ 0\end{array}\right]

แปลว่าถึงแม้เราจะไม่รู้ว่าแต่ละบิทมีค่าอะไร แต่ถ้าบิทหนึ่งมีค่าใด อีกบิทก็ต้องมีค่าตรงข้าม สังเกตว่า state รวมนี้ไม่สามารถเขียนแยกเป็น states ของสองระบบย่อยแยกกันได้ มิฉะนั้นผลคูณ pq ต้องเป็นศูนย์ แต่ถ้า p=0 หรือ q=0 ก็จะได้ข้อขัดแย้งว่า 0=\frac{1}{2} ว่าแต่เราหา marginal states ก่อนแล้วใช้ tensor product รวมมันกลับมาใหม่ไม่ได้เหรอ? Marginal states ของระบบคู่นี้คือ \{\frac{1}{2},\frac{1}{2}\} ไม่ว่าจะมองระบบเดี่ยวไหน ดังนั้น tensor product ของมันคือ

\left[\begin{array}{c}\frac{1}{4}\\ \frac{1}{4}\\ \frac{1}{4}\\ \frac{1}{4}\end{array}\right]

ซึ่งไม่ใช่ state เดิม! นี่คือสิ่งที่เกิดขึ้นเมื่อสองระบบมีความสัมพันธ์ (correlated) กัน ข้อมูลที่เรารู้ได้จากแต่ละระบบแยกกันมีน้อยกว่าข้อมูลที่เรารู้ได้จากการสังเกตระบบทั้งคู่ การรวมระบบด้วย tensor product และการที่เรามี state ของระบบร่วมที่ไม่สามารถเขียนได้เป็น tensor product ของระบบย่อยนี้เป็นจริงในทฤษฎีควอนตัมเช่นกัน

สมมติถ้าเรามีถุงมืออยู่คู่หนึ่ง แยกใส่สองกล่อง กล่องละข้าง แล้วเอาไปให้หนู A และนาย B โดยบอกว่าในกล่องมีถุงมืออยู่หนึ่งข้างแต่ไม่บอกว่ากล่องไหนมีข้างไหนอยู่ แล้วสองคนก็เดินทางแยกย้ายไปยังคนละซีกโลก เมื่อ A เปิดกล่องและพบถุงมือข้างใดข้างหนึ่งก็จะรู้ทันทีว่ากล่องของ B ต้องมีถุงมืออีกข้าง เป็นเรื่องธรรมดามากแต่ต้องเขียนถึงเพื่อจะบอกว่านี่ไม่ใช่ quantum entanglement!

มีอะไรผิดในคำบรรยายต่อไปนี้? “หาก A และ B มีระบบควอนตัมที่ entangled กันอยู่ ต่อให้ A และ B อยู่ไกลกันสุดขอบเอกภพ เมื่อ A ทำการวัด state ของระบบควอนตัมก็จะรู้ state ของระบบควอนตัมของ B ทันที เร็วกว่าแสง!”[2คำบรรยายนี้ไม่ได้มีอะไรเกี่ยวกับควอนตัมเลย เราสามารถเปลี่ยนคำว่าระบบควอนตัมเป็นถุงมือและคำว่า entangled เป็น correlated ได้โดยไม่มีอะไรเปลี่ยนแปลง มันจึงไม่ได้ให้ข้อสรุปว่าระบบสองระบบมีการสื่อสารกันในชั่วพริบตาแต่อย่างใด

การแปลง

State of knowledge ของเรามีการเปลี่ยนแปลงได้ด้วย law of total probability

p(b)=\sum_{a\in A} p(b|a)p(a)

channel

Law of total probability คือการบวกความน่าจะเป็นของทุกเส้นทางที่ให้ผลเดียวกันเข้าด้วยกันนั่นเอง

รอวาดใหม่ด้วยโปรแกรม

โดยที่ a เป็นค่าของบิทเก่าจากเซต Ab เป็นค่าของบิทใหม่จากเซต b, และ p(b|a) คือความน่าจะเป็นแบบเงื่อนไข (conditional probability หรือ transition probability) ที่บิทใหม่จะมีค่า b หากบิทเก่ามีค่า a

Law of total probability สามารถเขียนในรูปสมการเมทริกซ์ได้ว่า

\left[\begin{array}{c}p(b=0)\\p(b=1)\end{array}\right]=\left[\begin{array}{cc}p(b=0|a=0)&p(b=0|a=1)\\p(b=1|a=0)&p(b=1|a=1)\end{array}\right]\left[\begin{array}{c}p(a=0)\\p(a=1)\end{array}\right]

หรือแค่

v=Tu

โดยที่ u ต้องเป็นเวกเตอร์ของความน่าจะเป็นและ T เป็นเมทริกซ์ที่เลขในหลัก (column) เดียวกันต้องบวกกันได้ 1 (เพราะความน่าจะเป็นแบบเงื่อนไขก็ยังเป็นความน่าจะเป็น ต้องบวกกันได้ 1) ซึ่งจะทำให้ v เป็นเวกเตอร์ความน่าจะเป็นโดยอัตโนมัติ เมทริกซ์ที่มีคุณสมบัตินี้มีชื่อเรียกว่า stochastic matrix (stochastic มีรากศัพท์มาจากคำภาษากรีกว่า stochastikós มีความหมายหนึ่งว่าเดาสุ่ม)

สรุปแล้ว law of total probability บอกว่าเราสามารถแปลงของเวกเตอร์ความน่าจะเป็นด้วยการแปลงเชิงเส้น (linear transformation) ซึ่งเท่ากับการเขียนการแปลงด้วยเมทริกซ์ได้ และเงื่อนไขที่บังคับให้เมทริกซ์นี้เป็น stochastic matrix ก็คือเมทริกซ์การแปลงแปลงจาก state ไปยัง state เหมือนกับในทฤษฎีควอนตัม ซึ่งเทียบเท่ากับการแปลงเชิงเส้นด้วยสมการ Schrödinger

เราคาดว่าถ้าเราแปลงแค่ระบบย่อยหนึ่งของระบบรวม, marginal state ของอีกระบบย่อยจะไม่เปลี่ยนแปลงเพราะถ้าลองนึกว่า A ถืือส่วนหนึ่งของระบบย่อยไว้และ B ถืออีกส่วนหนึ่งไว้ และเดินทางไปคนละซีกโลกกัน(อีกแล้ว) ถ้าการกระทำของ A ต่อระบบของเธอมีผลต่อความน่าจะเป็นของระบบของ B แล้ว A อาจจะส่งข้อมูลให้ B ได้ในชั่วพริบตา เร็วกว่าแสง! ของจริง! ซึ่งจะปั่นป่วนกฎของฟิสิกส์ทุกแขนง ถ้าอยากจะพิสูจน์ก็ไม่ยาก สมมติว่าระบบย่อยที่เราสนใจเป็นบิท(เพื่อความสะดวกในการเขียน แต่ไม่จำเป็น) เราสามารถเขียนระบบรวมให้อยู่ในรูป

p\left[\begin{array}{c}1\\ 0 \end{array}\right]\otimes u+(1-p)\left[\begin{array}{c}0\\1\end{array}\right]\otimes v

ได้เสมอ โดยที่ u และ v เป็นเวกเตอร์ความน่าจะเป็นของระบบรวมของระบบย่อยที่เหลือที่เราไม่สนใจ จะได้ว่า marginal state ของบิทที่เราสนใจคือ \{p,1-p\}

ถ้าทำการแปลง T บนระบบที่เหลือ ระบบรวมจะเป็น

p\left[\begin{array}{c}1\\ 0 \end{array}\right]\otimes Tu+(1-p)\left[\begin{array}{c}0\\1\end{array}\right]\otimes Tv

ซึ่งให้ marginal state เดิม ในทฤษฎีควอนตัม การแปลงที่กระทำต่อระบบอื่นก็ไม่ส่งผลต่อ marginal state ของระบบที่เหลือ

การวัด

ความน่าจะเป็นที่เหรียญจะออกหัวหรือก้อยเมื่อเราเปิดซองดูก็แค่ตัวเลขในแต่ละแถว (row) ของเวกเตอร์ความน่าจะเป็น หลังจากเรารู้ผลแล้ว State ก็กลายเป็น pure state ที่แทนผลนั้นๆเพราะไม่มีความไม่แน่นอนหลงเหลืออยู่แล้ว

แต่ถ้าระบบของเราใหญ่กว่าบิทก็สามารถทำการวัดที่หยาบกว่านั้นได้ เช่น ถ้ามีสามเหตุการณ์อาจจะวัดว่าระบบอยู่ในเหตุการณ์ (0 หรือ 1), (0 หรือ 2),(1 หรือ 2) สมมติว่า state แรกเริ่มของระบบนี้คือ

\left[\begin{array}{c}p\\q\\1-p-q\end{array}\right]

ถ้าวัดแล้วได้ (0 หรือ 1) state ก็จะกลายเป็น

\frac{1}{p+q}\left[\begin{array}{c}p\\q\\ 0 \end{array}\right]

เพราะเรารู้แล้วว่าระบบไม่ได้อยู่ในเหตุการณ์ 2 แน่ๆ แต่ไม่รู้อะไรเกี่ยวกับสัดส่วนของ p และ q เลย

ถ้าเราจะเขียนการวัดเป็นเมทริกซ์เราสามารถกำหนดเมทริกซ์ที่ฉาย(project)เวกเตอร์ความน่าจะเป็นก่อนการวัดไปบน pure state ที่แทนผลการวัด

projection

การฉาย ความยาวของอย่างน้อยหนึ่งเวกเตอร์ที่ได้จะน้อยกว่า 1

รอวาดใหม่ด้วยโปรแกรม

สำหรับบิท, เมทริกซ์นี้ก็คือ P_0=\left[\begin{array}{cc}1& 0 \\ 0 & 0 \end{array}\right] สำหรับค่าบิท 0 และ P_1=\left[\begin{array}{cc} 0 & 0 \\ 0 & 1 \end{array}\right]

สำหรับค่าบิท 1 (stochastic matrix อย่าง \left[\begin{array}{cc} 1 & 1 \\ 0 & 0 \end{array}\right] ไม่ใช่การฉายเพราะมันส่งเวกเตอร์ไปยัง \{1,0\} เสมอไม่ว่าจะเริ่มต้นจากไหน)  สังเกตว่าผลรวมของเมทริกซ์การฉาย P_0+P_1 คือเมทริกซ์เอกลักษณ์ (identity matrix) หรือเมทริกซ์น่าเบื่อ เพราะมันไม่ทำอะไรเลย เทียบเท่ากับการวัด(ค่าบิท=0 หรือ 1)ซึ่งเป็นจริงเสมอและไม่ทำอะไรกับบิทนั้นเลย

เมื่อเมทริกซ์การฉายกระทำกับ state แล้วให้เวกเตอร์ที่อาจจะยาวน้อยกว่าเดิม

\tilde{v_a}=P_a u

ความยาวของเวกเตอร์นี้ก็คือความน่าจะเป็น p_a ที่จะได้ผล a นั่นเอง ดังนั่นเพื่อคืนความยาวของเวกเตอร์ให้เป็น 1, state หลังการวัดคือ

v_a=\frac{P_a u}{p(a)}

การวัดในทฤษฎีควอนตัมก็ใช้เมทริกซ์การฉายแบบนี้เหมือนกัน

เขียนเพิ่ม 10/26/13. สุดท้ายเหมือนกับการแปลง การวัดระบบหนึ่งก็ไม่สามารถเปลี่ยนแปลง marginal state ของอีกระบบหนึ่งได้ แต่อันนี้แทบไม่ต้องทำการพิสูจน์อะไรเพราะนิยามของ marginal state เองมาจากการเฉลี่ยความน่าจะเป็นของระบบอื่น เท่ากับไม่รู้ผลสังเกตใดๆจากระบบอื่นเลยนั่นเอง อ้าว! แล้วถ้า A กับ B แชร์สองบิทที่มีค่าเดียวกัน เมื่อ B เห็นค่าไหน A ก็รู้ว่ามีค่าเดียวกันนี่ จุดสำคัญตรงนี้คือว่า B ได้บอกผลกับ A หรือยัง? ถ้ายังไม่ได้บอก ระบบของ A ก็ยังคงต้องเป็น marginal state อยู่ ไม่ใช่ pure state ที่สอดคล้องกับผลที่ B ได้

การก๊อปปี้

ถึงแม้ปกติเราอาจจะคิดว่าความไม่แน่นอนเป็นอุปสรรคที่ต้องหลีกเลี่ยง แต่เราอาจจะต้องการตัวเลขสุ่มเพื่อป้องกันการลำเอียงในการสุ่มตัวอย่างทำการทดลองจริงหรือทำ Monte Carlo simulation, หรือเพื่อใช้สร้างพาสเวิร์ดที่เดาได้ยาก และถ้าไม่มีความไม่แน่นอนชีวิตคงน่าเบื่อน่าดู เราจึงอาจอยากจะก๊อปปี้ความไม่แน่นอนเพื่อแจกจ่ายแบ่งกันใช้ได้

ถ้าเรารู้การแจกแจงความน่าจะเป็นที่ต้องการจะใช้ เราก็สร้างมันได้ไม่จำกัดจำนวน เช่นผลิตเหรียญที่ถ่วงตามที่ต้องการ แต่การผลิตเหรียญต้องใช้เวลาและทรัพยากร หากเราได้ค่าที่สุ่มมาจาก state หนึ่งที่เราไม่รู้ เป็นไปได้ไหมที่จะก๊อปปี้ state นั้น? คำตอบก็ง่ายๆคือไม่ได้ แค่ค่าของบิทที่เห็นบอกเราไม่ได้ว่าเหรียญนั้นถ่วงขนาดไหน

หรือถ้าเราเอาซองไปก๊อปปี้โดยตรงเลย สิ่งที่ได้คือสองบิทที่สัมพันธ์กันซึ่งเรารู้ว่าเขียนเป็น tensor product ไม่ได้

\left[\begin{array}{c}p\\ 0 \\ 0 \\1-p\end{array}\right]\neq \left[\begin{array}{c}p\\1-p\end{array}\right]\otimes\left[\begin{array}{c}p\\1-p\end{array}\right]

ข้อสรุปนี้สามารถพิสูจน์อีกวิธีได้โดยสมมติว่าเรามีอีกบิทอยู่ใน pure state (ถ้ามี mixture ก็แตกเวกเตอร์เป็นผลบวกของ \{1,0\} กับ \{0,1\} เท่านั้นเอง ไม่มีอะไรเปลี่ยนแปลง) และเมื่อเราได้รับ state \{p,1-p\} มา เราก็สร้างก๊อปปี้ขึ้นมา

\left[\begin{array}{c}p\\1-p\end{array}\right]\otimes\left[\begin{array}{c}1\\ 0 \end{array}\right]\mapsto\left[\begin{array}{c}p\\1-p\end{array}\right]\otimes\left[\begin{array}{c}p\\1-p\end{array}\right]=\left[\begin{array}{c}p^2\\p(1-p)\\p(1-p)\\(1-p)^2 \end{array}\right]

ถ้าจะให้เครื่องก๊อปปี้ใช้กับ state ไหนก็ได้ เมทริกซ์ที่ทำการแปลงต้องไม่ขึ้นกับ p แต่นั่นเป็นไปไม่ได้ยกเว้นว่า p จะเท่ากับ 0 หรือ 1 เพราะเครื่องก๊อปปี้ต้องรับ p และให้ p^2 ออกมา ถ้าจะมองในภาพกว้าง, เราไม่สามารถก็อปปี้ state ได้เพราะการแปลงเป็นการแปลงเชิงเส้นนั่นเอง

เราก๊อปปี้ไม่ได้เพราะเราแยกแยะ state ที่ถูกส่งมาไม่ได้ คือบอกไม่ได้ว่าแต่ละค่าของบิทที่ได้มามาจาก state เดียวกันหรือไม่ ยกเว้นถ้าเรารู้ล่วงหน้าแล้วว่า state ที่จะถูกส่งมาเป็นไปได้แค่ pure state \{1,0\} หรือ \{0,1\} เพราะพอเราเห็นค่าบิทปุ๊บก็รู้เลยว่าส่ง state ไหนมา การที่เราไม่สามารถก๊อปปี้การแจกแจงความน่าจะเป็นได้จึงไม่ขัดกับการถ่ายเอกสารแต่อย่างใดเพราะเอกสารอยุ่ใน pure states ในทางกลับกันเราก็แยกแยะ state ทั่วไปไม่ได้เพราะเราก๊อปปี้ไม่ได้ ถ้าเราก๊อปปี้ state จากค่าบิทได้ พอได้ค่าบิทมาก็ก๊อปปี้ state ไว้ อาจจะผลิตเหรียญตาม state นั้นออกมาแล้วก็โยนไปเรื่อยๆจนเข้าใกล้อนันต์ครั้ง ความถี่ของหน้าที่ออกก็จะเท่ากับความน่าจะเป็นของหน้านั้นๆ เราก็จะรู้ state และแยกแยะ state ที่ให้ค่าของบิทแต่ละค่าออกมาได้ การวิเคราะห์นี้คงเดิมไม่เปลี่ยนแปลงในทฤษฎีควอนตัมที่มีทฤษฎีบท No-cloning ห้ามการก๊อปปี้ quantum state ที่ไม่รู้

เมื่อ A ได้ซองที่ใส่ค่าบิทมาจึงไม่สามารถก๊อปปี้ state u (unknown) ที่ให้ค่าบิทนั้นและแชร์ให้ B ได้ ไม่ A อ่านค่าของบิทนั้นเองก็ต้องเอาซองไปให้ B แต่เราจะมาดูกันว่าหาก A และ B แชร์สองบิทที่สัมพันธ์กันไว้ก่อนแล้ว คือครั้งหนึ่ง v อยู่ที่ A และอีกครึ่งหนึ่ง w อยู่ที่ B

\left[\begin{array}{c}\frac{1}{2}\\ 0 \\ 0 \\ \frac{1}{2}\end{array}\right]

A สามารถทำให้ state ของ w ที่ B มีอยุ่กลายเป็น state ของ u ได้โดยไม่ต้องส่งซองไปให้ B โดยตรง!

การเคลื่อนย้ายข้อมูลแบบไร้สัมผัส

เรารู้จากเรื่องการแปลงแล้วว่าการแปลงอย่างเดียวไม่ได้ทำให้ A รู้อะไรเพ่ิมขึ้นและไม่เปลี่ยนแปลง state ของ B, A จึงไม่มีทางเลือกนอกจากจะทำการวัด ถ้าจำเป็นอาจจะต้องทั้งแปลงทั้งวัด แต่จากที่เราพูดกันเรื่องการก๊อปปี้และแยกแยะข้างต้น เรารู้ว่าจะวัดให้ตายยังไงก็ไม่พอที่จะรู้ state ของ u เพื่อเอาไปบอก B แต่โชคดีที่ A แชร์บิทที่สัมพันธ์กับบิทของ B อยู่ ความหวังหนึ่งเดียวจึงเป็นการหาวิธีที่วัดหรือทั้งแปลงทั้งวัดที่จะทำให้ state ที่ B มีอยุ่กลายเป็น u ได้

ปรากฎว่ามีวิธีที่ใช้แค่การวัดที่มีโอกาสทำให้ marginal state ของ w กลายเป็น state ของ u ได้!

เพื่ออธิบายการวัดนี้ เราจะเขียน state ของทั้งสามบิทก่อน

\left[\begin{array}{c}p\\1-p\end{array}\right]_u\otimes\left[\begin{array}{c}\frac{1}{2}\\ 0 \\ 0 \\ \frac{1}{2}\end{array}\right]_{vw}=\frac{1}{2}\left[\begin{array}{c}p\\ 0 \\ 0 \\p\\1-p\\ 0 \\ 0 \\1-p\end{array}\right]_{uvw}

โดยแถวเรียงตามนี้ \{000,001,010,011,100,101,110,111\} ถ้าเราวัดว่าสองบิทแรกมีค่าเดียวกันหรือไม่และได้ผลว่ามันมีค่าเดียวกัน เราก็จะได้ marginal state ของ B เป็น \{p,1-p\} state ที่เคยเป็นของ u! แต่ถ้าได้ผลว่ามันมีค่าต่างกัน marginal state ของ B เป็น \{1-p,p\} สิ่งที่ A ต้องทำก็คือโทรศัพท์ไปบอกผลการวัดให้ B ถ้าได้ผลว่าสองบิทมีค่าเดียวกัน B ก็ไม่ต้องทำอะไร ถ้าไม่ใช่, B ก็ทำการแปลงสลับค่าบิทให้เป็น state ที่ต้องการซะ

แต่เราอาจจะไม่พอใจที่ marginal เฉยๆ ไม่ใช่บิทอิสระ ถ้าเราถือว่าการวัดเปลี่ยนสองบิท u และ v ให้เป็นบิทใหม่ x ที่ค่าของบิทคือผลของการวัด 0 เมื่อสองบิทแรกเริ่มมีค่าเหมือนกันหรือ 1 มื่อสองบิทแรกเริ่มมีค่าต่างกันแล้ว (การกระทำการแบบนี้เรียกว่า exclusive or หรือย่อว่า XOR ในตรรกะบูลีน(Boolean logic) แทนด้วยเครื่องหมาย \oplus) เราจะได้ state รวมใหม่ว่า

\frac{1}{2}\left[\begin{array}{c}p\\ 1-p \\ 1-p \\ p \end{array}\right]_xw=\frac{1}{2}\left[\begin{array}{c} 1 \\ 0 \end{array}\right]_x\otimes \left[\begin{array}{c} p \\ 1-p \end{array}\right]_w+\frac{1}{2}\left[\begin{array}{c} 0 \\ 1 \end{array}\right]_x\otimes \left[\begin{array}{c} 1-p \\ p \end{array}\right]_w

เมื่อ B ได้บิท x ไปก็นำไปพลิก state ของ w โดยการ XOR อีกรอบก็จะได้

\left[\begin{array}{c}p\\1-p\end{array}\right]

ตามที่ต้องการ เท่านี้เราก็สามารถเคลื่อนย้ายข้อมุลจากบิทหนึ่งไปยังอีกบิทหนึ่งโดยที่ไม่ได้เคลื่อนย้ายระบบทางกายภาพเลย เป็นการเคลื่อนย้ายข้อมูลแบบไร้สัมผัส[3]

2_20101221175121 thai

วิธีเคลื่อนย้ายข้อมูลแบบนี้ไม่ขัดกับข้อห้ามการก๊อปปี้ state เพราะหลังจาก XOR แล้ว A ก็ไม่มีบิทเดิมเหลืออยู่อีก

แน่นอนว่าต้องมีความน่าจะเป็นที่วิธีนี้จะ”พลาด”เป็นผลทำให้ไม่ว่าอย่างไร A ก็ต้องโทรศัพท์ไปบอก B ให้แก้ไขที่ปลายทาง มิฉะนั้นเราจะใช้วิธีนี้ส่งข้อมูลเร็วกว่าแสงได้

สุดท้ายมีจุดที่น่าสนใจอีกจุดหนึ่งคือด้วยวิธีนี้เหมือนกับเราได้ส่งจำนวนจริง p ซึ่งอาจมีทศนิยมไม่รู้จบ ให้กับ B ผ่านทางผลการวัดซึ่งเป็นไปได้แค่สองค่า เท่ากับบิทเดียวเท่านั้นเอง เป็นไปได้อย่างไร? นอกจากนี้ผลการวัดที่ A ส่งให้ B ไม่ได้มีข้อมูลเกี่ยวกับ state u อยู่เลยเพราะความน่าจะเป็นที่จะได้ผลการวัดเป็นครึ่งครึ่งเสมอไม่ขึ้นอยู่กับ p แต่อย่างใด เหตุการณ์ลักษณะเดียวกันนี้ก็ปรากฎใน quantum teleportation แต่เราก็ได้เห็นแล้วว่ามันไม่ได้เกิดขึ้นในทฤษฎีควอนตัมเท่านั้น

และนี่ก็เป็นการจบการทัวร์ทฤษฎีความน่าจะเป็น ผมต้องขอขอบคุณถ้าท่านอ่านตั้งแต่ต้นจนจบเพราะความยาวของมันและถ้าไม่คุ้นกับการคิดเรื่องพวกนี้คงจะต้องใช้ความพยายามไม่ใช่น้อย  เราได้เห็นความคล้ายกันอย่างมากของทฤษฎีควอนตัมกับความน่าจะเป็น แต่แน่นอนว่าจะต้องมีข้อแตกต่างกันไม่อย่างนั้นเราจะสนใจทฤษฎีควอนตัมไปทำไม

ในทฤษฎีความน่าจะเป็น

1. State เป็นเวกเตอร์ยาว 1 หน่วยของจำนวนไม่ติดลบ
2. ระบบหลายระบบรวมกันด้วย tensor product
3. การแปลงต้องนำ state ไปสู่ state (เวกเตอร์ยาว 1 หน่วยของจำนวนไม่ติดลบ)
4. การวัดแทนด้วยการฉาย
5. ก็อปปี้ state ที่ไม่รู้ไม่ได้
6. ความเป็นไปได้ของการเคลื่อนย้ายข้อมูลแบบไร้สัมผัส

ในเมื่อข้อ 2 – 6 เป็นจริงในควอนตัมเช่นกัน สาเหตุที่ทำให้ควอนตัมเป็นควอนตัมก็ต้องเป็นข้อแรก ในครั้งหน้าเราจะพบว่าการเปลี่ยนข้อนั้นเพียงแค่นิดเดียวทำให้หลายๆอย่างที่เกิดขึ้นได้กับ mixed state เกิดขึ้นกับ pure quantum states นั่นหมายความว่าในโลกควอนตัม ถึงแม้เราจะรู้มากที่สุดเท่าที่จะรู้ได้แล้ว (มี pure states) ก็ยังมีความไม่แน่นอนได้!

อ้างอิง

[1] เช่น Steven Weinberg. Lectures on Quantum Mechanics. Cambridge University Press, 2012. หน้า 346
[2] เช่น สุทัศน์ ยกส้าน. “113 ปี “ฟิสิกส์ควอนตัม” ที่ทำให้โลกเป็นอย่างทุกวันนี้.Manager Online. 18 ตุลาคม 2013. Web. 20 ตุลาคม 2013
[3] นี่คือวิธีการเข้ารหัสลับแบบ one-time pad เอามาดัดแปลงให้ใกล้เคียงกับ quantum teleportation มากที่สุด

About Ninnat Dangniam

นักเรียน, นักเขียน, นักวาด
This entry was posted in Quantum. Bookmark the permalink.

One Response to A No-Nonsense Introduction to Quantum Theory ตอนที่ 1

  1. Pingback: A No-Nonsense Introduction to Quantum Theory | A Diary

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s