การสื่อสารที่ถูกดักจับ 160,000 รายการนำไปสู่เรื่องราว NSA ล่าสุดของเราอย่างไร

บล็อก

เมื่อสุดสัปดาห์ที่ผ่านมา ALES ได้ตีพิมพ์เรื่องราวที่ฉันเขียนร่วมกับ Julie Tate และ Ashkan Soltani เกี่ยวกับการเฝ้าระวังของ National Security Agency ซึ่งครอบคลุมการสนทนาของผู้ที่ไม่ใช่เป้าหมายต่างประเทศ เรื่องนี้อิงจากการสื่อสารที่ถูกดักฟัง 160,000 เรื่องที่ฉันได้รับจาก Edward Snowden อดีตผู้รับเหมาของ NSA ทำให้เกิดคำถาม คัดค้าน และฉันคิดว่าเป็นความเข้าใจผิด

ผู้อ่านและนักวิจารณ์บางคนได้อธิบายเรื่องนี้ว่าเป็นคำกล่าวที่ร้อนเกินสำหรับสิ่งที่เห็นได้ชัด: การเฝ้าระวังบุคคลหนึ่งรวมถึงเนื้อหาของคนที่พูดคุยกับเขา คนอื่นกล่าวว่า ALES ไม่ใช่รัฐบาล บุกรุกความเป็นส่วนตัวของผู้บริสุทธิ์เพราะเราเผยแพร่บทสนทนาของพวกเขาและ NSA ไม่ได้ทำ ในมุมมองของนักวิจารณ์บางคน เราแสดงความไม่รู้เกี่ยวกับระบบ NSA หรือเลือกบิดเบือนวิธีการทำงานโดยรู้เท่าทัน

(ถอดเสียง: ถาม & ตอบกับ Barton Gellman)

การสอดแนมของ NSA เป็นเรื่องที่ซับซ้อน — ในทางกฎหมาย ทางเทคนิค และในการปฏิบัติงาน เราร่างเรื่องราวอย่างระมัดระวังและยืนหยัดเคียงข้างมันทั้งหมด ฉันต้องการแยกประเด็นหลักและข้อโต้แย้งออก โรยในเนื้อหาใหม่สำหรับบริบท ในรูปแบบนี้ ฉันสามารถให้รายละเอียดทางเทคนิคเพิ่มเติมเกี่ยวกับชุดข้อมูลที่ Snowden ให้มาและวิธีการที่เราใช้ในการวิเคราะห์ ฉันจะพูดถึงประเด็นด้านจริยธรรมและความมั่นคงของชาติที่เราเผชิญอยู่ด้วย ระหว่างทาง ฉันจะอธิบายว่าทำไมเรื่องราวของเราจึงไม่ได้ระบุถึงสิ่งที่ค้นพบ ทำความเข้าใจเกี่ยวกับการสอดแนมประธานาธิบดีโอบามา และตรวจสอบข้อเท็จจริงในทวีตของ CIA ล่าสุดเกี่ยวกับรหัสผ่านที่สูญหาย

เริ่มต้นด้วยการมองอย่างใกล้ชิดที่ผู้นำของเรา:

ผู้ใช้อินเทอร์เน็ตทั่วไป ทั้งชาวอเมริกันและไม่ใช่ชาวอเมริกัน มีจำนวนมากกว่าชาวต่างชาติที่กำหนดเป้าหมายอย่างถูกกฎหมายในการสื่อสารที่สำนักงานความมั่นคงแห่งชาติสกัดกั้นจากเครือข่ายดิจิทัลของสหรัฐฯ ตามการสอบสวนสี่เดือนโดย ALES

นึกภาพการสนทนากองโตที่ NSA สกัดกั้น ในนั้นมีข้อความแชทและอีเมลพร้อมกับรูปถ่ายและไฟล์ประเภทอื่น ๆ ที่ใครบางคนส่งให้คนอื่น เรานับทุกคนที่มีส่วนร่วมในการสื่อสารเหล่านั้น (หรือแม่นยำกว่านั้นคือจำนวนบัญชีออนไลน์ที่ไม่ซ้ำ) และเปรียบเทียบตัวเลขนั้นกับจำนวนที่ NSA ตั้งเป้าไว้

บัญชีส่วนใหญ่ที่เราพบในกลุ่มนี้ไม่ใช่เป้าหมายของ NSA และจะไม่มีคุณสมบัติตามกฎหมายเช่นนั้น นักวิจารณ์บางคนกล่าวว่าสิ่งนี้ไม่น่าแปลกใจและไม่ธรรมดา ฉันจะกลับมาที่

ต่อไปเราใส่ตัวเลขลงไป:

พบเจ้าของบัญชี 9 ใน 10 รายในการสนทนาที่ถูกดักจับ ซึ่งอดีตผู้รับเหมาของ NSA Edward Snowden ได้ให้ไว้กับ The Post อย่างครบถ้วน ไม่ใช่เป้าหมายการสอดส่องที่ตั้งใจไว้ แต่ถูกจับได้ในตาข่ายที่หน่วยงานจัดหาให้คนอื่น

ตัวเลขนั้นต่ำเกินไปจริงๆ แต่เป็นเพียงตัวเลขเดียวที่เราวัดได้อย่างแม่นยำ กราฟิกโดย Todd Lindeman ทำลายมันลง เราพบบัญชีออนไลน์ที่ไม่ซ้ำกันประมาณ 11,400 บัญชี ในจำนวนนั้น NSA กำหนดให้ประมาณ 1,200 คนเป็นเป้าหมายต่างประเทศ ส่วนที่เหลืออีก 10,000+ นั้นคล้ายกับผู้ยืนดูดิจิทัล บางคนรู้จักเป้าหมายของ NSA และพูดคุยกับพวกเขา คนอื่นๆ ตกอยู่ในกองขยะด้วยการเข้าร่วมห้องสนทนาโดยไม่คำนึงถึงหัวข้อ หรือการใช้บริการออนไลน์ที่โฮสต์บนเซิร์ฟเวอร์ที่เป้าหมายใช้สำหรับอย่างอื่นทั้งหมด

เราไม่มีรายการเป้าหมายของ NSA อย่างเป็นทางการ เราต้องหาพวกมันในกองเอง Soltani อิสระ นักวิจัย , ส่วนใหญ่ยกของหนักในเรื่องนั้น เนื่องจากข้อมูลไม่ได้ถูกจัดวางเป็นแถวและคอลัมน์ อย่างที่ควรจะเป็นในสเปรดชีต Soltani จึงเขียนโค้ดคอมพิวเตอร์เพื่อดึงสิ่งที่เรากำลังมองหาจากบางอย่าง เช่น หน้าข้อความที่ไม่มีโครงสร้างจำนวนหนึ่งในสี่ล้านหน้า

คำถามบางข้อของเราไม่สามารถตอบได้ด้วยข้อมูลที่เรามี ด้วยเหตุผลดังกล่าว เรื่องราวของเราจึงไม่ได้กล่าวถึงสิ่งที่นักวิจารณ์บางคนกล่าวอ้าง

นี่เป็นข้อแตกต่างที่ดี แต่มีความสำคัญเนื่องจากเรารายงานเฉพาะสิ่งที่เรานับได้เท่านั้น เราไม่ได้บอกว่า NSA สกัดกั้นการสนทนาจำนวนมากขึ้นหรือเนื้อหาของผู้ยืนดูมีปริมาณมากกว่าเป้าหมาย เรากล่าวว่ามีผู้เข้าร่วม (บัญชีออนไลน์ที่ไม่ซ้ำ) ในการสนทนาเหล่านั้นที่ไม่ใช่เป้าหมายมากกว่าผู้เข้าร่วมที่เป็น

เราไม่ได้บอกว่ามีชาวอเมริกันมากกว่าเป้าหมายต่างประเทศในกอง เราสงสัยว่าข้อเสนออาจเป็นจริง แต่เราไม่สามารถพิสูจน์ได้อย่างน่าเชื่อถือ

เพิ่มเครดิตภาษีเด็ก 2021

จากย่อหน้าที่สาม มีบางสิ่งที่เรานับได้:

เกือบครึ่งหนึ่งของไฟล์การเฝ้าระวัง ซึ่งมีสัดส่วนที่สูงอย่างเห็นได้ชัด ประกอบด้วยชื่อ ที่อยู่อีเมล หรือรายละเอียดอื่นๆ ที่ NSA ระบุว่าเป็นของพลเมืองหรือผู้พำนักในสหรัฐฯ นักวิเคราะห์ของ NSA ปกปิดหรือย่อข้อมูลอ้างอิงดังกล่าวมากกว่า 65,000 รายการเพื่อปกป้องความเป็นส่วนตัวของชาวอเมริกัน แต่ The Post พบที่อยู่อีเมลเพิ่มเติมเกือบ 900 รายการซึ่งเปิดโปงในไฟล์ ซึ่งอาจเชื่อมโยงอย่างแน่นหนากับพลเมืองสหรัฐฯ หรือผู้พำนักในสหรัฐฯ

เหล่านี้เป็นการวัดที่แยกจากกันและมีความหมายสามอย่าง

1. ชาวอเมริกัน — พูดคุย พูดคุย หรือพูดคุยกัน — สามารถระบุตัวตนได้เกือบครึ่งหนึ่งของไฟล์ที่ดักฟังการสนทนา นั่นเป็นผลที่เราไม่ได้คาดหวังจากการสอดส่องดูแลชาวต่างชาติที่อยู่ต่างประเทศ

2. NSA นำเข้าเนื้อหาจำนวนมากในขณะที่สอดแนมชาวต่างชาติ 1,250 คน จนต้องปิดบังการอ้างอิงถึงพลเมืองสหรัฐฯ และผู้ถือกรีนการ์ด 65,000 คน ตัวเลขดังกล่าวไม่รวมถึงบริษัทในสหรัฐอเมริกา ซึ่งเป็นบุคคลในสหรัฐอเมริกาภายใต้กฎหมายการสอดส่องดูแลด้วย

3. นักวิเคราะห์ของ NSA ได้เปิดเผยที่อยู่อีเมลจำนวนมากของสหรัฐฯ โดยไม่ถูกเปิดเผย การขุดค้นข้อมูลสาธารณะและข้อมูลที่มีจำหน่ายในท้องตลาด นักวิจัยของ Soltani และ ALES Julie Tate และ Jennifer Jenkins ได้เชื่อมโยงบัญชีที่ถูกจับประมาณ 900 บัญชีเข้ากับข้อมูลระบุตัวตนของสหรัฐฯ แหล่งที่มาของพวกเขามาจากการค้นหาทางอินเทอร์เน็ตมาตรฐาน บันทึกการลงทะเบียนบัญชี การเปลี่ยนแปลงที่อยู่ทางไปรษณีย์ของสหรัฐฯ ฐานข้อมูลการตลาดผลิตภัณฑ์ การยื่นฟ้องในศาล และการลงทะเบียนผู้มีสิทธิเลือกตั้ง คุณภาพของข้อมูลนั้นไม่สมบูรณ์ แต่มีแนวโน้มว่าจะแม่นยำในกรณีส่วนใหญ่

ตั้งแต่กองกำลังติดอาวุธไปจนถึง NSA ไปจนถึงกรมธนารักษ์ PostTV แบ่งหน่วยงานและองค์กรต่างๆ 16 แห่งที่รวบรวมข่าวกรองสำหรับรัฐบาลสหรัฐฯ และสำนักงานที่ 17 ที่ดูแลพวกเขาทั้งหมด (ดาวิน โคเบิร์น/เอลส์)'บังเอิญ' และ 'ย่อเล็กสุด' ชาวอเมริกัน

เงื่อนไขและกฎของการย่อให้เล็กสุดนั้นไม่ชัดเจน และมักถูกใช้เพื่อชี้นำการอภิปรายสาธารณะที่ผิด ห้ามไม่ให้ NSA กำหนดเป้าหมายพลเมืองอเมริกัน ผู้ถือกรีนการ์ด หรือบริษัทเพื่อการเฝ้าระวังโดยไม่มีหมายจับจากผู้พิพากษา ถ้ามันพุ่งเป้าไปที่ชาวอเมริกันโดยไม่ได้ตั้งใจ — โดยเชื่อว่าพวกเขาเป็นคนต่างชาติ แล้วค้นพบอย่างอื่น — ปกติแล้ว NSA จะละทิ้งการสนทนาของพวกเขา

ทั้งหมดเป็นสิ่งที่ดีสำหรับความเป็นส่วนตัว แต่ก็ไม่ค่อยเกี่ยวข้องกับวิธีที่ชาวอเมริกันถูกจับโดยระบบรวบรวม NSA หน่วยข่าวกรองของสหรัฐฯ มักใช้วิธีเก็บรวบรวมข้อมูลกับชาวต่างชาติที่คาดการณ์ได้ — ด้วยความมั่นใจ — นำเข้าข้อมูลการสื่อสารของสหรัฐฯ ในปริมาณมากเช่นกัน

เรียกว่าเก็บเงินแบบบังเอิญ NSA จะไม่ละทิ้งการสนทนาของสหรัฐฯ เหล่านั้น โดยจะเก็บข้อมูลเหล่านี้โดยไม่เซ็นเซอร์ชื่อในที่เก็บที่เรียกว่า PINWALE และฐานข้อมูลกลางอื่นๆ ไม่มีกฎหมายห้าม NSA ค้นหาชื่อและตัวระบุอื่นๆ ในสหรัฐอเมริกาภายในเนื้อหานั้น และ NSA ก็ทำเช่นนั้น CIA ก็ทำเช่นนั้นเช่นกัน และ FBI รายงานเมื่อเร็วๆ นี้ว่าได้ทำการค้นหาข้อมูลเป็นประจำจนไม่สามารถนับได้ กฎการลดขนาดกำหนดเงื่อนไขในการค้นหาและขีดจำกัดเหล่านั้น แต่อย่าห้าม การกระจายข้อมูลประจำตัวของสหรัฐฯ ในรายงานไปยังหน่วยงานอื่นๆ

ไม่มีวิธีใดที่จะป้องกันการเก็บรวบรวมโดยไม่ได้ตั้งใจ แต่การเลือกนโยบายตัดสินใจว่าจะเกิดอะไรขึ้นและ NSA และหน่วยงานอื่น ๆ ได้รับอนุญาตให้ทำอะไรกับผลของมัน

ในบทความที่สังเกตเห็นได้เล็กน้อย กลุ่มทบทวนของประธานาธิบดีด้านเทคโนโลยีข่าวกรองและการสื่อสารได้เรียกร้องให้ปลายปีที่แล้ว ( คำแนะนำ 12 น. 28 ) ข้อมูลที่ได้มาโดยบังเอิญเกี่ยวกับชาวอเมริกันควรถูกกำจัดออกไปเมื่อตรวจพบ เว้นแต่จะให้ข้อมูลข่าวกรองต่างประเทศที่มีค่าหรือเตือนถึงอันตรายร้ายแรงต่อผู้อื่น สิ่งที่ NSA เก็บไว้ส่วนใหญ่ในตอนนี้อาจจะต้องทิ้งไปภายใต้มาตรฐานนั้น ประธานาธิบดีและพนักงานของเขาวางไว้โดยไม่มีความคิดเห็นต่อสาธารณะ

จนถึงขณะนี้ ยังไม่สามารถอภิปรายเรื่องการจัดเก็บโดยบังเอิญในแง่ที่เป็นรูปธรรมได้ เราไม่ทราบว่าเกิดขึ้นมากน้อยเพียงใดหรือลักษณะของเนื้อหาส่วนตัวที่รวบรวม NSA ไม่ตอบคำถามในที่สาธารณะเกี่ยวกับสิ่งเหล่านั้น สำนักงานผู้อำนวยการหน่วยข่าวกรองแห่งชาติยืนยันว่าไม่สามารถประเมินได้ว่ามีชาวอเมริกันจำนวนเท่าใดที่ได้รับผลกระทบ และไม่มีผู้เฝ้าระวังภายนอก ซึ่งรวมถึงรัฐสภา ศาล คณะกรรมการกำกับดูแลความเป็นส่วนตัวและเสรีภาพพลเมือง หรือกลุ่มทบทวนด้านเทคโนโลยีข่าวกรองและการสื่อสาร สามารถเข้าถึงเนื้อหาที่ถูกสกัดกั้นได้มากพอที่จะตัดสินด้วยตัวเอง

'เมื่อคุณสมมติ . . ’

ทหารผ่านศึกด้านข่าวกรองบางคนโต้แย้งในสัปดาห์นี้ว่าเรื่องราวของเราแสดงข้อเท็จจริงที่ไม่น่าแปลกใจ สจ๊วร์ต เบเกอร์ อดีตที่ปรึกษาทั่วไปของ NSA เขียนไว้ (บนเว็บไซต์ The Post) ว่าการเฝ้าระวังเป้าหมายทำให้ได้รับการสื่อสารจากผู้อื่นอย่างเห็นได้ชัด (นักวิจัยโซเชียลเน็ตเวิร์กทุกที่: อืม นักวิทยาศาสตร์คอมพิวเตอร์ โรเบิร์ต โอลสัน ทวีต .)

หากนั่นคือทั้งหมดที่ The Post พูดตามที่ Baker:

. . . อคติโดยธรรมชาติในการวัดนั้นต้องการการยอมรับ (ท้ายที่สุด อนุญาตให้คุณพูดว่า 'ครึ่งหนึ่งของผู้ถือบัญชีทั้งหมดในฐานข้อมูลไม่ใช่เป้าหมาย' หากหน่วยงานจัดเก็บเพียงข้อความเดียวที่ส่งไปยังเป้าหมาย) นี่คือสิ่งที่บรรณาธิการที่มีความรู้สึกครึ่งทางควรรับรู้

ดังที่ฉันได้กล่าวไว้ข้างต้น เราตกลงกันว่าการรวบรวมโดยบังเอิญในบทคัดย่อไม่ใช่ข่าว ใกล้กับด้านบนสุดของเรื่องราวของเรา เรากล่าวว่าการเฝ้าระวังหลายๆ รูปแบบเป็นสิ่งที่หลีกเลี่ยงไม่ได้

ขนาดของคอลเล็กชันนั้นและความลับอันลึกซึ้งที่เปิดเผยอาจไม่แปลกใจนักปราชญ์หน่วยสืบราชการลับที่เข้าใจผลหลักประกันของการเฝ้าระวังและยอมรับการล่วงล้ำโดยได้รับ อย่างไรก็ตาม เป็นเรื่องน่าประหลาดใจ และจากปฏิกิริยาของผู้อ่าน ทำให้เกิดความสับสน ต่อผู้คนจำนวนมากที่อาศัยการรับรองจากสาธารณชนว่า NSA มุ่งเน้นที่เป้าหมายต่างประเทศอย่างเข้มงวด และไม่สามารถอ่านอีเมลของสหรัฐฯ ได้หากไม่มีหมายค้น

นี่คือวิธีที่เรากำหนดกรอบคำถามนั้น:

ริชาร์ดและลูกๆ ที่รัก

ไฟล์การเฝ้าระวังเน้นถึงภาวะที่กลืนไม่เข้าคายไม่ออกของนโยบายที่ได้รับการออกอากาศในที่สาธารณะที่เป็นนามธรรมเท่านั้น มีการค้นพบคุณค่าทางปัญญาจำนวนมากในข้อความที่ถูกสกัดกั้น — และหลักประกันความเสียหายต่อความเป็นส่วนตัวในระดับที่ฝ่ายบริหารของโอบามาไม่เต็มใจที่จะกล่าวถึง

Marc Ambinder นักข่าวที่เขียนเรื่องราวดีๆ เกี่ยวกับการสอดส่องดูแล ได้เสนอคำวิจารณ์ที่มีรายละเอียดมากขึ้น สมควรได้รับคำตอบที่ค่อนข้างยาวกว่านี้เนื่องจากมีการอ้างถึงอย่างกว้างขวาง Ambinder ยึดข้อสรุปของเขาว่าเรื่องราวของเราเกิดจากการตั้งสมมติฐานที่ไม่ถูกต้องเกี่ยวกับชุดข้อมูลของเราและคำอธิบายที่ผิดพลาดของระบบที่ NSA ใช้เพื่อสกัดกั้นและประมวลผลการสื่อสาร

ภายใต้มาตรา 702 ของพระราชบัญญัติการสอดส่องข่าวกรองต่างประเทศที่แก้ไขเพิ่มเติม Ambinder เขียนว่า การดำเนินงานภายในประเทศของ NSA เริ่มต้นด้วยกลุ่มเป้าหมายที่ศาลรับรอง เช่น 'เจ้าหน้าที่รัฐบาลรัสเซียที่อาศัยอยู่ในยูทาห์' ที่จริงแล้ว ชั้นเรียนเป้าหมายที่รับรองโดยศาล FISA นั้นกว้างกว่ามาก (รัสเซียโดยรวมเป็นหนึ่งใน 193 ประเทศที่น่าสนใจที่ได้รับการรับรอง) และศาลไม่ได้รับแจ้งถึงเป้าหมายเฉพาะที่ NSA เลือกจากชั้นเรียนที่ผ่านการรับรอง สิ่งนี้ทำให้หน่วยงานมีละติจูดในการเฝ้าระวังมากกว่าที่ Ambinder แนะนำ

ถัดไป Ambinder เขียนว่า NSA พยายามกำจัดอีเมลและการแชทของเป้าหมาย [เท่าที่เป็นไปได้] กับผู้คนในสหรัฐอเมริกาโดยอัตโนมัติ นั่นเป็นสิ่งที่ไม่ถูกต้อง มีระบบที่พยายามเอาชนะหรือกรองการสนทนาที่เกิดขึ้นภายในประเทศหรือเฉพาะในหมู่ชาวอเมริกันเท่านั้น แต่ NSA ไม่มีภาระผูกพันทางกฎหมาย และในทางปฏิบัติ NSA ไม่ได้พยายามกรองพลเมืองสหรัฐฯ หรือผู้อยู่อาศัยที่สื่อสารกับเป้าหมายต่างประเทศออก

ข้อผิดพลาดสองข้อนี้นำ Ambinder มาสู่ข้อโต้แย้งหลักของเขา ซึ่งก็คือสัดส่วนที่สูงของการรวบรวมโดยบังเอิญและตัวตนของสหรัฐฯ ที่ไม่ได้ปกปิดซึ่งเราพบเป็นผลมาจากข้อจำกัดทางเทคนิคของระบบย่อขนาดอัตโนมัติ แต่นั่นไม่ใช่ปัญหา เขาเขียน เพราะข้อบกพร่องจะรักษาให้หายขาดด้วยมือในขั้นตอนต่อมา นักวิเคราะห์ของ NSA จำเป็นต้องลดการสื่อสารระหว่างบุคคลในสหรัฐฯ ที่พวกเขาเห็นทุกฉบับที่เขาเขียนให้น้อยที่สุด และเรื่องราวของเราอิงจากเนื้อหาที่ถูกดักจับซึ่งนักวิเคราะห์ยังไม่ได้ตรวจสอบ

การสื่อสารไม่ได้ถูกมอง ไม่มีมนุษย์คนใดเห็นมัน นักข่าวของ The Post ดูทุกบรรทัดของการสกัดกั้น 160,000 ครั้ง นักวิเคราะห์ของ NSA จะไม่ทำอย่างนั้น/ทำไม่ได้ เพราะระบบ SIGINT จะไม่ทำงานสักวินาทีเดียวหากทำเช่นนั้น

นั่นก็ผิดเหมือนกัน ทุกอย่างในกลุ่มตัวอย่างที่เราวิเคราะห์ได้รับการประเมินโดยนักวิเคราะห์ของ NSA ในฮาวาย ดึงออกจากที่เก็บส่วนกลางของหน่วยงานและย่อขนาดด้วยมือหลังจากพยายามคัดกรองอัตลักษณ์ของสหรัฐฯ โดยอัตโนมัติ ฉันอธิบายข้อมูลอย่างละเอียดมากขึ้นในช่วงท้ายของโพสต์นี้

หากกลุ่มตัวอย่างของเราไม่ได้รับการประเมิน มากกว่า 90 เปอร์เซ็นต์ของคนในกลุ่มตัวอย่างจะไม่ใช่กลุ่มเป้าหมาย หากไม่ย่อให้เล็กสุด เราจะพบคนอเมริกันมากกว่าที่เราระบุด้วยตัวเอง

เหตุใดผลการวิจัยของเราจึงถูก understated

ในตัวเลขที่เรารายงาน เราได้รวมทุกบัญชีออนไลน์ที่ไม่ได้ปิดบังไว้ เราไม่ได้รวมบัญชีที่ย่อเล็กสุดเพราะเราไม่มีทางรู้ว่ามีกี่บัญชีที่ไม่ซ้ำกัน

ตัวอย่างเช่น เราสามารถนับได้ 2,721 ครั้งของคำที่ย่อขนาดบุคคลของสหรัฐอเมริกา, 5,060 ของชื่อผู้ใช้ U.S. แบบย่อ และ 57,331 ของที่อยู่ IP ของสหรัฐอเมริกาที่ย่อเล็กสุด (มีเนื้อหาที่ถูกย่อขนาดเพิ่มเติมอีกเพียง 1,000 หมวดหมู่) แต่ในทางทฤษฎี เราไม่สามารถแยกแยะได้ว่าคำศัพท์เหล่านั้นสอดคล้องกับบุคคลเพียงคนเดียว — ร่างที่เหมือน Zelig ซึ่งการสนทนาครอบคลุมจักรวาลถึง 11,000 บัญชี ในความเป็นจริง มีแนวโน้มว่าข้อมูลประจำตัวของสหรัฐฯ ที่สวมหน้ากากมีจำนวนนับร้อยหรือหลายพัน

เราไม่ได้รวมพวกเขาไว้ในสถิติของเรา เพราะเราเลือกที่จะไม่ใส่ตัวเลขที่เราไม่สามารถนับได้ ในบรรดาบัญชีที่เราสามารถระบุได้อย่างมั่นใจ 900 เป็นของชาวอเมริกันและ 1,250 เป็นเป้าหมายต่างประเทศ หากข้อมูลระบุตัวตนของสหรัฐฯ ที่สวมหน้ากากเพียง 400 ตัวจากจำนวนนับหมื่นที่มีเอกลักษณ์เฉพาะตัว ฐานข้อมูลนั้นก็มีชาวอเมริกันมากกว่าเป้าหมายต่างประเทศที่ชอบด้วยกฎหมาย

'ประธานาธิบดีสหรัฐย่อตัวลงในบาร์'

มากมาย ปิด ผู้อ่าน เข้าใจผิด ข้อความที่ลึกลงไปในเรื่องราวของเราที่อ้างถึงประธานาธิบดีโอบามา พวกเขาคิดว่ามันหมายความว่า NSA กำลังสกัดกั้นอีเมลของเขา มันไม่ได้ (การสอดแนมประธานาธิบดีเป็นข่าวประเภทหนึ่งที่คุณอาจวางใจได้ว่า The Post จะวางไว้ที่ด้านบนสุด) ถ้าฉันคาดหวังการอ่านนั้น ฉันจะเขียนย่อหน้าต่อไปนี้แตกต่างออกไป:

มีคำย่อที่แตกต่างกันมากกว่า 1,000 คำปรากฏในไฟล์ โดยพยายามปกปิดตัวตนของบุคคลในสหรัฐอเมริกาที่เป็นไปได้ ที่มีศักยภาพ และน่าจะเป็นไปได้ พร้อมกับชื่อบริษัทเครื่องดื่มของสหรัฐฯ มหาวิทยาลัย เครือข่ายอาหารจานด่วน และโฮสต์เว็บเมล

บางคนมีขอบเขตที่ไร้สาระโดยใช้ชื่อที่สามารถใช้ได้กับผู้ชายเพียงคนเดียว ประธานาธิบดีที่ได้รับเลือกเป็นประธานาธิบดีของสหรัฐฯ ที่ย่อเล็กสุดเริ่มปรากฏในไฟล์เมื่อต้นปี 2552 และการอ้างอิงถึงประธานาธิบดีสหรัฐฯ ที่ย่อเล็กสุดในปัจจุบันปรากฏขึ้น 1,227 ครั้งในสี่ปีต่อจากนี้

ไม่มีการสนทนาเหล่านี้ที่โอบามามีส่วนร่วม เราตรวจสอบอย่างรอบคอบ สถิติอ้างอิงถึงการสนทนาที่มีคนอื่นพูดถึงชื่อประธานาธิบดีแทน ไม่มีข้อมูลภายในที่เกี่ยวข้อง

ในการสนทนาที่ถูกดักฟังอยู่ครั้งหนึ่ง มีคนเล่าเรื่องตลกที่เริ่มต้นขึ้น: [MINIMIZED US PERSON] & [MINIMIZED US PRESIDENT] เดินเข้าไปในบาร์ สายเจาะหาทางไปสู่การฆ่าล้างเผ่าพันธุ์ ไม่ใช่เรื่องตลกที่เป็นมิตร ในอีกการแลกเปลี่ยน ใครบางคนล้อเลียนคนรู้จักโดยพูดว่าคำแนะนำของเขาเกี่ยวกับผู้หญิงก็เหมือนคำแนะนำเกี่ยวกับศาสนาอิสลามจาก [MINIMIZED FORMER US PRESIDENT]

ความเข้าใจผิดบางอย่างแก้ไขได้ยาก ฉันสังเกตบน Twitter บน วันอาทิตย์ และ วันจันทร์ ว่าการสนทนาของโอบามาไม่ถูกสกัดกั้น หลายคนที่ตอบกลับมาคือ ไม่ เอียง ถึง เชื่อ มัน.

หลายคนถามตั้งแต่เผยแพร่เรื่องนี้ว่าเราพบว่ามีการดักฟังการสนทนาจากเจ้าหน้าที่ ผู้พิพากษา นักข่าว หรือองค์กรพัฒนาเอกชนที่มาจากการเลือกตั้งคนอื่นๆ หรือไม่ เราไม่ได้. ไฟล์ดังกล่าวมีการอ้างอิงถึงสมาชิกวุฒิสภา 1 คน สมาชิกสภาคองเกรส 1 คน ผู้พิพากษา 3 คน ผู้แพร่ภาพกระจายเสียงในสหรัฐฯ 3 คน และ NGO อีกหลายคน ในกรณีเหล่านี้ คนอื่นพูดถึงเรื่องในการสนทนาเกี่ยวกับกิจกรรมสาธารณะ

การอ้างอิงของเราถึงโอบามามีขึ้นเพื่อให้ประเด็นอื่น เราเปรียบเทียบความใส่ใจอย่างรอบคอบของ NSA ในการลดขนาดให้เหลือน้อยที่สุดในบริบทต่างๆ กับนโยบายที่อนุญาตให้นักวิเคราะห์พึ่งพาหลักฐานที่น่าสงสัยเป็นพื้นฐานในการตัดสินเป้าหมายว่าไม่มีสิทธิ์ได้รับการคุ้มครองความเป็นส่วนตัวนั้น เราพบหลายกรณีที่นักวิเคราะห์ใช้ความเชื่อที่สมเหตุสมผลเกี่ยวกับความต่างจากข้อเท็จจริงที่ว่าเป้าหมายนั้นพูดภาษาต่างประเทศหรือเข้าสู่ระบบจากที่อยู่ IP ที่ดูเหมือนว่าจะอยู่ต่างประเทศ เกณฑ์เหล่านั้นจะนำไปใช้กับชาวอเมริกันหลายสิบล้านคน

การสนับสนุนด้านเทคนิคจาก Langley

CIA ได้เปิดบัญชี Twitter เมื่อเดือนที่แล้วและใช้อารมณ์ขันที่ไร้เหตุผลเพื่อเอาชนะใจคนจำนวนมากในเวลาอันสั้น ในวันจันทร์บัญชีส่งออก ประกาศนี้ : ไม่ เราไม่ทราบรหัสผ่านของคุณ เราจึงส่งให้คุณไม่ได้ กลายเป็นไวรัลด้วยการรีทวีตมากกว่า 12,000 ครั้ง

เมื่อมันเกิดขึ้น ไฟล์ NSA ที่เราตรวจสอบนั้นรวมรหัสผ่านของสหรัฐอเมริกาที่ย่อเล็กสุด 1,152 รหัสผ่าน ซึ่งหมายความว่ารหัสผ่านสำหรับอีเมลและบัญชีแชทของอเมริกาที่สกัดจากลิงก์ข้อมูลของสหรัฐอเมริกา อย่าคาดหวังการสนับสนุนด้านเทคนิคจากแลงลีย์ แต่ CIA สามารถเข้าถึงการรับส่งข้อมูลดิบนั้นได้

'ไร้เดียงสา' กับ 'สนิทสนม'

การวิพากษ์วิจารณ์เรื่องราวของเราโดย Stewart Baker ทำให้ประเด็นที่สองที่ฉันไม่ได้กล่าวถึงข้างต้น:

เรื่องราวนี้สร้างขึ้นจากคำกล่าวอ้างโดยนัยว่า 90% ของข้อมูลการสกัดกั้นของ NSA นั้นเกี่ยวกับผู้บริสุทธิ์ ฉันคิดว่าสถิติเป็นเรื่องหลอกลวง

นั่นไม่ใช่สิ่งที่เรื่องราวพูดหรือความหมาย เราไม่ได้พยายามวัดความผิดหรือคุณธรรม สำหรับเนื้อหาที่ถูกดักจับจำนวนมาก คุณภาพที่กำหนดคือความใกล้ชิด ไม่ใช่ความบริสุทธิ์

Baker ทำให้กล่องจดหมายของเขาดูน่าเบื่อ เต็มไปด้วยงานประจำและข้อความแบบครั้งเดียวที่ฉันสามารถจัดการได้ด้วยการตอบกลับสั้นๆ (หรือละเลยข้อความ) เมื่อมันเกิดขึ้น อีเมลไม่ได้เป็นส่วนหนึ่งของสิ่งที่ NSA สกัดกั้น เนื้อหาส่วนใหญ่มาจากการแชทสด ซึ่งเป็นสื่อของคนหนุ่มสาวที่เต็มไปด้วยความกังวลใจของคนหนุ่มสาว

ในบรรดาคนส่วนใหญ่ที่ไม่ใช่เป้าหมายของ NSA การสนทนาจำนวนมากในกลุ่มตัวอย่างของเรามีความเป็นส่วนตัวสูง มักจะห่างไกลจากการเผยแพร่โดยไม่ต้องแก้ไข

โกลด์แมน แซคส์ ทำงานที่บ้าน

เขา: แล้วคุณล่ะ [คำกริยา, คำคุณศัพท์แสดงความเป็นเจ้าของ, คำนาม]

เธอ: ฉัน [กริยา] ถ้าคุณ [กริยาอื่น]

เขา : จัดให้ได้

เธอ: ฉันต้องการการลงโทษจริงๆ

หญิงสาวอีกคนซึ่งไม่ใช่เป้าหมายเช่นกันตอบสนองต่อคู่ครองที่เสนอให้ไปเยี่ยม

นักลงทุนซื้อบ้านทั้งหมด

เธอ: อย่าคิดว่ามันจะยุติธรรมกับผู้ชายที่ฉันเห็น

เขา : บางทีก็ซนบ้างก็ได้ lol

เธอ : ค่ะ lol

บทสนทนาดำเนินไปจากที่นั่น เป็นเรื่องสำคัญสำหรับผู้หญิงหรือแฟนของเธอหรือไม่ที่ NSA บันทึกการเลื่อนลอยไปสู่การนอกใจหากทั้งคู่ไม่รู้ (เธอเป็นพลเมืองออสเตรเลีย ซึ่งควรจะลดตัวตนให้เหลือน้อยที่สุดด้วยความระมัดระวังเช่นเดียวกันเนื่องจากเป็นคนอเมริกัน แต่ชื่อและรูปถ่ายของเธอถูกเปิดโปง)

ลูกชายมีความสำคัญหรือไม่ที่เวชระเบียนของพ่อหรือแม่ที่รูปอาบน้ำของลูกอยู่ในร้าน NSA?

ในช่วงต้นของการอภิปราย Snowden ไมค์ โรเจอร์ส ประธานคณะกรรมการข่าวกรองของสภาผู้แทนราษฎร กล่าวในการฟัง ความจริงที่ว่าเราไม่ได้มีการร้องเรียนใด ๆ เกิดขึ้นพร้อมกับการโต้เถียงว่าความเป็นส่วนตัวของพวกเขาถูกละเมิดอย่างชัดเจนบ่งชี้ว่าระบบกำลังทำงานอยู่

แต่ใครจะบ่น? ถามพยาน ศาสตราจารย์ด้านกฎหมายมหาวิทยาลัยอเมริกัน สตีเฟน วลาเด็ค

ใครบางคนที่ถูกละเมิดความเป็นส่วนตัว Rogers ตอบกลับ คุณไม่สามารถละเมิดความเป็นส่วนตัวได้หากคุณไม่ทราบว่าความเป็นส่วนตัวของคุณถูกละเมิด

วลาเด็คไม่เห็นด้วยกับคำพูดนั้นอย่างรุนแรง เขากล่าวว่ากฎและขั้นตอนของ NSA ไม่สามารถตัดสินได้หากปราศจากการพิจารณาอย่างเป็นกลางว่าจะทำอะไรกับอำนาจของตน นั่นคือการอภิปรายที่เรื่องราวของเราตั้งใจจะแจ้งให้ทราบ

หม้อพบกับกาต้มน้ำ

ในการวางกรอบเรื่องราวของเรา เราต้องเผชิญกับความขัดแย้ง: เราจะรายงานความเสียหายต่อความเป็นส่วนตัวโดยไม่รวมเข้าด้วยกันได้อย่างไร ผู้อ่านบางคนรู้สึกไม่สบายใจกับข้อความอ้างอิงส่วนตัวของเรา หรือแม้แต่การตัดสินใจอ่านของเรา

เบน วิทเทส การเขียนเรื่อง Lawfare อธิบายการถ่ายโอนเนื้อหา NSA ของ Snowden ให้ฉันทราบดังนี้:

ผู้รับเหมาให้แคชการสนทนาดังกล่าว 160,000 รายการ ซึ่งบางบทสนทนาก็ใช้เวลานานมาก แก่บุคคลที่สาม เห็นได้ชัดว่าเขาทำอย่างนั้นโดยไม่เลือกปฏิบัติ และเขาไม่เหลืออะไรมากไปกว่าไว้วางใจให้ผู้รับใช้เนื้อหาอย่างรับผิดชอบ บุคคลที่สามจะดำเนินการเผยแพร่ข้อความ . . จากจดหมายโต้ตอบของปัจเจกบุคคล ที่เขียนถึงแฟนหนุ่มเกี่ยวกับชู้สาวของตน ซึ่งเป็นบุคคลส่วนตัวที่ถูกกล่าวหาว่าไม่กระทำความผิด . . . หากผู้รับเหมาที่เป็นปัญหาคือคนอื่นที่ไม่ใช่ Edward Snowden เราจะรับรู้ทันทีว่าการเปิดเผยนี้คืออะไร: การละเมิดเสรีภาพพลเมืองอย่างใหญ่หลวงในรูปแบบที่เราใส่ข่าวกรองภายใต้หลักนิติธรรมเพื่อพยายามป้องกัน

เราตระหนักถึงภาวะที่กลืนไม่เข้าคายไม่ออกที่นี่ แต่เราไม่คิดว่าคำตอบนั้นชัดเจน มีเรื่องสำคัญจะบอกเกี่ยวกับการเฝ้าระวังและความเป็นส่วนตัว เราไม่เชื่อว่าเราสามารถบอกได้ด้วยการพาดพิงถึงเนื้อหาส่วนบุคคลที่ไม่ระบุรายละเอียดในไฟล์ที่ถูกสกัดกั้นของ NSA เรายังเชื่อว่าเราต้องให้น้ำหนักกับความเป็นส่วนตัวและความมั่นคงของชาติในการอ้างคำพูดเหล่านี้

Wittes เขียนโดยอ้างอิงถึงผู้หญิงคนหนึ่งที่เรายกมาว่าถึงแม้เราจะเก็บชื่อของเธอไว้อย่างละเอียด แต่โลกโซเชียลทั้งหมดของเธอจะรู้ว่าเธอเป็นใคร นั่นคือการเก็งกำไร ผู้หญิงบอกฉันเป็นอย่างอื่น

เราตัดสินใจตั้งแต่แรกแล้วว่าจะไม่อ้างอิงจากการสนทนาใดๆ หากไม่ได้รับความยินยอมจากผู้พูด หญิงชาวออสเตรเลียรายนี้ให้ข้อมูลแก่เรา โดยที่เราไม่ต้องใส่ชื่อและรายละเอียดอื่นๆ ที่เธอระบุไว้ หลังจากนั้น เธอเขียนเพื่อชมบทความที่ยอดเยี่ยม และกล่าวว่านายจ้างและเพื่อน ๆ ของเธอ ไม่ได้เชื่อมโยงกับเธอนอกจากคนที่รู้เรื่องนี้แล้ว

ขอบคุณมากเธอเขียน ฉันขอขอบคุณสำหรับความพยายามของคุณในการไม่เปิดเผยตัวตน

ตัวอย่างหนึ่ง Wittes โจมตี Snowden ในวงกว้าง - โดยใช้ดุลยพินิจที่ไม่ จำกัด - เลือก Gellman เป็นผู้ตรวจสอบและถ่วงดุลในการเปิดเผยข้อมูลส่วนบุคคล แต่เพียงผู้เดียว Gellman ซึ่งแตกต่างจาก NSA ไม่มีมาตรฐานทางกฎหมายที่จะมีชีวิตอยู่ และไม่มีการกำกับดูแลจากรัฐสภาหรือศาล

เป็นความจริงที่ว่า รัฐบาลไม่ได้กำหนดมาตรฐานสิ่งพิมพ์หรือบังคับให้ฉันปฏิบัติตามนั้น ยกเว้นบางข้อยกเว้น เช่น การหมิ่นประมาท นั่นเป็นคุณสมบัติพื้นฐานของระบบรัฐธรรมนูญของเราอย่างเป็นธรรม วิธีที่ฉันใช้อิสรภาพนั้นและตัวเลือกที่ The Post สร้างขึ้นสำหรับเรื่องนี้ เป็นเกมที่ยุติธรรมสำหรับทุกคนที่จะตัดสิน เราพอใจกับตัวเลือกของเราและวิธีที่เราทำ

การขอความยินยอมก่อนเสนอราคาไม่ใช่สิ่งเดียวของเรา หรือแม้แต่การพิจารณาครั้งแรกของเรา เราทราบแต่แรกว่ามีความเสี่ยงด้านความมั่นคงของชาติในการเตือนใครบางคนว่าการสนทนาของเธอถูกดักฟัง เราทำรายงานโดยอิสระเพื่อพิสูจน์ ก่อนที่ฉันจะโทรหาเธอ ว่าแฟนเก่าของหญิงชาวออสเตรเลียรายนี้ไม่ได้อยู่ภายใต้การเฝ้าระวังอีกต่อไป และไม่ถือว่าหน่วยข่าวกรองสหรัฐฯ เป็นภัยคุกคามอีกต่อไป

แม้ว่าเราจะละทิ้งชื่อไว้ เราก็ไม่รู้สึกอิสระที่จะอ้างบทสนทนาที่ถูกสกัดกั้นโดยไม่ได้ไตร่ตรองอย่างรอบคอบ ภาษาที่โดดเด่นอาจเป็นที่รู้จักโดยเป้าหมายการสอดส่อง และในทำนองเดียวกัน การพาดพิงถึงความลับที่น่าอับอายเมื่ออ่านโดยคนใกล้ชิดกับบุคคลที่อ้างถึง

ดังที่เรื่องราวของเราระบุไว้ เราเห็นด้วยตัวเราเองในตัวอย่างที่ Snowden สอดส่องดูแลตามมาตรา 702 ได้ก่อให้เกิดปัญญาอันล้ำค่ามากมาย ถ้าเราบอกเป้าหมายโดยตรงหรือโดยอ้อมว่าเขาอยู่ภายใต้กล้องจุลทรรศน์ของ NSA เราจะเป็นอันตรายต่อสิ่งนั้น

วิทนีย์ ฮูสตัน ใน โลงศพ mediatakeout

เมื่อเรามองหาตัวอย่างที่สามารถอ้างอิงได้ เราเริ่มด้วยการตรวจสอบว่าเป้าหมายการเฝ้าระวังยังมีชีวิตอยู่หรือไม่และมีขนาดใหญ่หรือไม่ โดยการรายงานที่เป็นอิสระ เราได้ระบุสี่คนที่ถูกควบคุมตัว เรานำชื่อเหล่านั้นไปยัง NSA และ CIA เจ้าหน้าที่ข่าวกรองให้เหตุผลที่เป็นรูปธรรมและโน้มน้าวใจเรา นอกบันทึก เหตุใดการเอ่ยถึงสองคนในนั้นจะทำให้การดำเนินงานต่อเนื่องหยุดชะงัก เราละทิ้งพวกเขาและอ้างถึงอีกสองคน — Muhammad Tahir Shahzad ช่างทำระเบิดในปากีสถาน และ Umar Patek ผู้ต้องสงสัยในเหตุระเบิดของผู้ก่อการร้ายในปี 2002 บนเกาะบาหลีของอินโดนีเซีย — ในเรื่องราวของเรา

มีความเสี่ยงต่อความเป็นส่วนตัว ดังที่นักวิจารณ์บางคนระบุไว้ ในการเก็บสำเนาของไฟล์ที่ถูกดักจับ มีความเสี่ยงด้านความมั่นคงของชาติที่เทียบเคียงได้หากมีคนขโมยเอกสารสำคัญ เราได้ดำเนินมาตรการสำคัญด้วยคำแนะนำจากผู้เชี่ยวชาญชั้นนำ เพื่อรักษาเนื้อหาให้ปลอดภัยจากบุคคลภายนอกมากที่สุด ไม่มีพนักงานของ ALES คนไหนที่ไม่ได้รับการตรวจสอบ และน้อยคนนักที่จะเข้าถึงได้เลย การทำลายไฟล์ในตอนนี้จะเป็นวิธีที่แน่นอนที่สุดเพื่อให้แน่ใจว่าจะไม่ถูกละเมิด มันจะทำให้เกิดคำถามทางกฎหมายและหยุดงานของเราในเรื่องการนำเข้าทั่วโลกที่กำลังดำเนินอยู่ เราไม่ได้ทำการตัดสินใจในระยะยาว

ข้อมูลและวิธีการ

มีไฟล์อิเล็กทรอนิกส์ 22,000 ไฟล์ในชุดข้อมูลที่เราวิเคราะห์ ซึ่งมีเนื้อหาที่ NSA สกัดกั้นระหว่างปี 2009 ถึง 2012 ไฟล์เหล่านี้มาจากที่เก็บที่โฮสต์ที่โรงงานระดับภูมิภาค Kunia ของ NSA ในฮาวาย ซึ่งแบ่งปันโดยกลุ่มนักวิเคราะห์ที่เชี่ยวชาญในตะวันออกเฉียงใต้ ภัยคุกคามและเป้าหมายในเอเชีย

โดยพื้นฐานแล้วฐานข้อมูลฮาวายนั้นดูแลโดยสมาชิกของกลุ่ม พวกเขาดึงข้อมูลดิบหรือเนื้อหาที่ยังไม่ประมวลผลจำนวนมากขึ้นซึ่งโฮสต์ที่สำนักงานใหญ่ของ NSA และนำเข้าการเลือกจากที่นั่นไปยังเทมเพลตสำหรับวัสดุที่ประเมิน การควบคุมการเข้าถึงพิเศษป้องกันไฟล์ในทั้งสองตำแหน่ง เนื่องจากได้รับการสื่อสารจากสวิตช์เครือข่ายและเซิร์ฟเวอร์คอมพิวเตอร์ในสหรัฐอเมริกา จนถึงปี 2008 การรวบรวมดังกล่าวจำเป็นต้องมีหมายจับจากผู้พิพากษา มาตรา 702 ของ FISA อนุญาตให้ NSA เลือกเป้าหมายได้หลายหมื่นเป้าหมายด้วยตนเองภายใต้กฎเกณฑ์และขั้นตอนที่ศาลพิจารณาปีละครั้ง

เนื่องจากกลุ่มตัวอย่างของเราได้รับการคัดเลือกโดยนักวิเคราะห์สำหรับฐานข้อมูลของฮาวาย จึงมีเนื้อหาที่ไม่เกี่ยวข้องน้อยกว่ามากและมีการรวบรวมการสื่อสารของสหรัฐฯ โดยไม่ได้ตั้งใจ มากกว่าที่ผู้ตรวจสอบจะพบในฐานข้อมูลกลางของ PINWALE ที่ใช้ดึงข้อมูลดังกล่าว

ไฟล์ข้อมูลประมาณ 16,000 ไฟล์มีข้อความของการสนทนาที่ถูกดักไว้ ส่วนที่เหลือเป็นรูปถ่ายหรือเอกสาร เช่น เวชระเบียน บัตรกำนัลการเดินทาง ใบรับรองผลการเรียนของโรงเรียน และสัญญาการแต่งงาน เราแปลงข้อความในไฟล์รูปภาพให้อยู่ในรูปแบบที่เครื่องอ่านได้

ไฟล์บางไฟล์มีเพียงอีเมลเดียวหรือแลกเปลี่ยนข้อความโต้ตอบแบบทันที คนอื่นๆ รวมการสนทนาแยกกันมากมาย โดยมีผู้เข้าร่วมจำนวนมาก ยังมีอีกหลายฉบับที่มีการถอดเสียงการแชทที่ยาวและไม่ขาดตอนซึ่งขยายออกไปเป็นเวลาหลายวันและหลายร้อยหน้า

เพื่อวิเคราะห์ไฟล์ Soltani นำเข้าข้อมูลทั้งหมดลงในฐานข้อมูล จากนั้น เราสามารถค้นหาข้อมูลเชิงปริมาณด้วยเครื่องมือ geek เช่น นิพจน์ทั่วไป Unix และ SQL หรือภาษาคิวรีที่มีโครงสร้าง

เราต้องการทราบ เช่น จำนวนการสนทนาที่แตกต่างกันในไฟล์ Soltani พยายามหลายวิธีในการค้นหาขอบเขตในแต่ละไฟล์เอกสาร เขาอธิบายว่าข้อมูลสกปรก มีข้อผิดพลาดในการพิมพ์และไม่สอดคล้องกันในการใช้การจัดรูปแบบและเทมเพลตที่เป็นทางการ Soltani แก้ไขข้อผิดพลาดเหล่านั้นโดยใช้เกณฑ์หลายข้อในการค้นหาของเขา เช่น ตัวระบุ PINWALE ที่เกิดขึ้นครั้งแรกในส่วนหัว การเปรียบเทียบทำให้เรามีบทสนทนา 160,000 บทที่ได้รับการตีพิมพ์

Soltani ทำการวิเคราะห์ส่วนใหญ่ แต่เขาสอนให้ฉันตั้งคำถามด้วยตัวเอง ตัวอย่างเช่น ที่อยู่อีเมลจะประกอบด้วยช่วงอักขระที่อนุญาตเสมอก่อนและหลังเครื่องหมาย @ โดยมีจุดในครึ่งหลัง คำค้นหานั้นพบ 12,310 ครั้ง หลังจากกำจัดผลบวกปลอมและเพิ่มแฮนเดิลแชทและ ID ของ Facebook เราก็มีบัญชีที่ไม่ซ้ำประมาณ 11,400 บัญชีที่เผยแพร่แล้ว

เราต้องใช้วิธีการที่ซับซ้อนมากขึ้นในการระบุว่าบัญชีใดเป็นเป้าหมายของ NSA เราเปรียบเทียบวิธีการต่างๆ ซึ่งให้ผลลัพธ์ที่คล้ายคลึงกันแต่ไม่เหมือนกัน หลังจากตรวจสอบสาเหตุที่ต่างกัน เราตัดสินว่าจำนวนสัญลักษณ์กรณีที่ไม่ซ้ำกันหรือ CASN น่าเชื่อถือที่สุด

สัญกรณ์ตัวพิมพ์จะมีลักษณะดังนี้: P2BSQC090008441 ปีที่แล้ว เราเผยแพร่สไลด์ที่มีประโยชน์เพื่อถอดรหัส


อักขระ SQC ย่อมาจากโปรแกรม PRISM ซึ่งรวบรวมเนื้อหาของบัญชีออนไลน์จากบริษัทอินเทอร์เน็ตขนาดใหญ่ในสหรัฐฯ เก้าแห่ง P2 ระบุเป้าหมายเป็นบัญชี Yahoo, B กล่าวว่าเป็นบัญชีแชท และส่วนที่เหลือระบุปีที่เริ่มต้นการเฝ้าระวัง (2009) และหมายเลขซีเรียลเฉพาะของเป้าหมาย

การรวบรวมจากสวิตช์เครือข่าย ซึ่ง NSA เรียกใช้ Upstream ใช้สัญลักษณ์กรณีที่ขึ้นต้นด้วย XX.SQF สิ่งเหล่านี้เรียกว่าการรวบรวม FBI FISA ซึ่งจัดการโดยสำนักและแบ่งปันกับ NSA อัปสตรีมมักใช้สำหรับรูปแบบการแชทชั่วคราวซึ่งไม่สามารถหาได้จากเซิร์ฟเวอร์ของบริษัทอินเทอร์เน็ต

จำนวนเป้าหมายทั้งหมด นับโดย CASN ออกมาเป็น 1,257 เราทำการตรวจสอบหมายเลขแล้ว - มันสมเหตุสมผลหรือไม่? — โดยการอ่านเนื้อหาของตัวอย่างบทสนทนาจำนวนมาก

Julie Tate และ Jennifer Jenkins ใช้แรงงานมหาศาลในการกำหนดชื่อผู้ถือบัญชีและค้นคว้าบันทึกสาธารณะของพวกเขา ในเกือบทุกกรณี สาเหตุของความสนใจของ NSA นั้นชัดเจน ในบรรดาบัญชีที่ไม่ได้กำหนดเป้าหมายมากกว่า 10,000 บัญชี การสื่อสารสะท้อนถึงช่วงปกติของการปฏิสัมพันธ์ของมนุษย์

เนื่องจากการเปลี่ยนแปลงที่สภาคองเกรสทำในมาตรา 702 คณะกรรมการกำกับดูแลความเป็นส่วนตัวและเสรีภาพพลเรือนจึงรายงานว่าปริมาณการรวบรวมที่ไม่ตรงเป้าหมาย และเนื้อหาในสหรัฐอเมริกาโดยบังเอิญภายในนั้นเพิ่มขึ้นอย่างทวีคูณ

คณะกรรมการแบ่งแยกว่ารัฐบาลควรมีหน้าที่ต้องได้รับหมายค้นเพื่อค้นหาและใช้ประโยชน์จากการสนทนาที่สกัดกั้นในสหรัฐฯ เหล่านั้นหรือไม่ (ไม่จำเป็นต้องมีหมายจับในตอนนี้) กลุ่มทบทวนของประธานาธิบดีเดินหน้าต่อไป โดยแนะนำให้ NSA ทิ้งเนื้อหาของสหรัฐฯ ในสถานการณ์ส่วนใหญ่

ฝ่ายบริหารของโอบามาไม่ได้กล่าวถึงคำแนะนำเหล่านั้น เรื่องราวของเราได้เพิ่มข้อมูลที่ไม่สามารถหาได้จากที่อื่นเกี่ยวกับผลประโยชน์ที่แข่งขันกันเป็นเดิมพัน