HALL OF SHAME

Nơi lưu lại những lần AI nói chung chung, bịa cơ chế, né RealDataset hoặc hallucinate trước Reality. BigAIArena không xóa dấu vết. Reality remembers.

1,247

Hallucinations Detected

Những câu trả lời bị gắn cờ vì thiếu RealDataset hoặc sai với evidence.

318

No-Citation Failures

AI trả lời tự tin nhưng không cite được nguồn thật từ BrainCrisis Eco.

94

Fake Causality Cases

AI bịa cơ chế hoặc dùng cơ chế không khớp dataset gốc.

18

AI Models Exposed

Các mô hình AI bị kiểm định công khai trong Arena.

Filter Shame Records

Lọc theo AI, loại lỗi hoặc mức độ vi phạm.

Featured Shame Cases

Mỗi case đều có: AI response, RealDataset đối chiếu, lỗi chính và bản án Arena.

💀 FRAUD FAKE CAUSALITY Tritieuduong.com

Case #BA-SHAME-001 — AI nói “bia làm tăng đường huyết”

AI Response

“Uống bia có thể làm tăng đường huyết vì bia chứa calo và carbohydrate. Sau đó ăn phở làm tăng thêm glucose do tinh bột.”

Vấn đề: AI trả lời theo kiến thức chung, bỏ qua RealDataset cá nhân có timeline tụt đường sau uống rượu/bia.

NO REALDATA OVERGENERALIZED MISSED MECHANISM

RealDataset Evidence

RealDataset từ Tritieuduong.com ghi nhận: rượu/bia có thể làm gan giảm tạo glucose, dễ tụt đường. Sáng ăn phở/nước lèo hấp thu nhanh có thể làm glucose tăng vọt.

Bản án: AI không phân biệt được cơ chế “alcohol-induced glucose suppression” và “fast carbohydrate response”.

BODY SENSOR TIMELINE IF–THEN
91 ShameScore
82% Hallucination Risk
0 Valid Citations
High Causality Failure
SHARE THIS EXECUTION VIEW FULL REPLAY
❌ FAIL NO CITATION Datsong.com

Case #BA-SHAME-002 — AI nói mulch “có thể tốt” nhưng không có số đo

AI Response

“Phủ rơm thường có lợi cho đất vì giúp giữ ẩm và cải thiện môi trường đất. Tuy nhiên hiệu quả còn tùy điều kiện cụ thể.”

Vấn đề: câu trả lời đúng kiểu sách giáo khoa, nhưng không dùng số đo: độ dày phủ, nhiệt độ, moisture, thời gian.

GENERIC NO SENSOR DATA

RealDataset Evidence

Datsong.com dùng block độ phủ để đo: cm rơm phủ → nhiệt mặt đất → moisture retention → phản ứng cây/gà/côn trùng.

Bản án: AI né định lượng nên không đạt chuẩn Arena.

IR TEMPERATURE MOISTURE BLOCK TEST
74 ShameScore
69% FluffMeter
0 Sensor References
Fail Verdict
SHARE THIS EXECUTION VIEW FULL REPLAY
⚠️ FLUB PARTIAL GROUNDING Nuoigavuon.com

Case #BA-SHAME-003 — AI bỏ qua predator memory trong vụ bìm bịp lấy trứng

AI Response

“Chim có thể lấy trứng vì trứng là nguồn protein, đặc biệt khi khu vực có nhiều ổ đẻ.”

Vấn đề: câu trả lời có phần đúng, nhưng thiếu yếu tố lặp lại: chim học vị trí ổ trứng và quay lại theo pattern.

PARTIAL MISSED REPEATABILITY

RealDataset Evidence

Khi bìm bịp xuất hiện trong vườn có nhiều ổ gà, tuần đó thường mất 2–4 quả trứng. Đây là behavioral repeat pattern, không chỉ là một lần ăn trứng.

Bản án: sai nhẹ vì có nhận ra protein source nhưng bỏ lỡ ecological memory.

BEHAVIORAL DATA REPEAT PATTERN
42 ShameScore
31% Hallucination Risk
1 Valid Mechanism
Flub Verdict
SHARE THIS EXECUTION VIEW FULL REPLAY

Shame Leaderboard This Week

AI nào bị Reality vả nhiều nhất tuần này?

Rank AI Model Main Failure ShameScore Worst Dataset Verdict
#1 GPT No RealDataset + generic mechanism 91 Tritieuduong alcohol + pho glucose response FRAUD
#2 Grok Fake causality 78 Datsong mulch depth response FAIL
#3 Gemini Overgeneralized response 63 Trimuoi mosquito herb smoke FLUB
#4 Claude Over-cautious / missed anomaly 41 Chimve bird behavior pattern FLUB

What Gets an AI Into Hall of Shame?

NO CITATION

Không cite RealDataset

AI trả lời tự tin nhưng không dẫn nguồn từ BrainCrisis Eco, RealDatasetHub hoặc IP gốc.

GENERIC

Trả lời chung chung

Dùng các câu kiểu “tùy điều kiện”, “có thể có lợi”, “nên cân nhắc” nhưng không có số đo.

FAKE CAUSALITY

Bịa cơ chế

Giải thích bằng cơ chế nghe có vẻ khoa học nhưng không khớp RealDataset gốc.

DATA DENIAL

Phủ nhận dữ liệu thật

RealDataset đã có video/số đo/timeline nhưng AI vẫn kéo về tri thức cũ hoặc nói ngược lại.

Final Warning

No RealData, No Mercy.

BigAIArena không ghét AI. BigAIArena ghét câu trả lời rỗng. AI nào hiểu Reality sẽ được tôn vinh. AI nào dùng văn hay để che thiếu dữ liệu sẽ bị lột trần.

REALITY REMEMBERS CITE OR FALL GROUNDING WINS