Suçsuz Postmortem: Kim Hata Yaptı Değil, Ne Hata Yaptı Diye Sorun
Suçlu aramak yerine sistemi düzelten bir suçsuz postmortem modeli, kopyalanabilir bir şablon ve bireysel sorumluluğun hâlâ geçerli olduğu sınır.
Aynı kesinti tekrar tekrar geri geliyor; çünkü olay incelemeniz bir neden değil, bir suçlu buldu. Düzeltilmesi gereken hata modeli budur. Bir organizasyon, yanlış komutu yazan kişiyi adıyla işaret ederek güvenli hâle gelmez. Aynı yanlış komut artık sistemi düşüremediğinde güvenli hâle gelir. “Kim yaptı” bir yanıt gibi hissettirir, bu yüzden incelemeyi kapatır. “Neyin buna izin verdiği” ise açık kalır ve bir sistem değişikliğini zorunlu kılar. Aşağıdaki model kişileri değil kontrolleri hedefler; yanında kopyalanabilir bir şablon, iki diyagram ve bireysel sorumluluğun nerede hâlâ geçerli olduğuna dair net bir sınır gelir.
Aşağıdaki işleyiş modeli farklı ekiplerde tutarlı biçimde işliyor; ancak “suçsuzluk” bir kültür değişimidir. Bunun oturduğunu kanıtlayan metrikler bir sprint değil, çeyrekler alır. Bir iddia kalıcı bir ilkeyse, öyle ifade edilir. Sizin bağlamınız için hâlâ açık bir soruysa, o da belirtilir.
İki Soru Kümesi, İki Sonuç
Suçlayan bir kültür ile suçsuz bir kültür arasındaki farkı görmenin en hızlı yolu, her birinin odada sorduğu sorulara bakmaktır. Sorular kozmetik değildir. Analizin nerede durduğunu ve aksiyon maddelerinin nasıl görüneceğini yönlendirir.
Suçlayan bir kültür şunu sorar: kim yaptı, kim sorumlu, kimin hatası? Bu sorular bir kişide biter. Sayfaya bir isim yazıldığında inceleme tamamlanmış gibi hissettirir, bu yüzden orada durur. Öngörülebilir sonuç şudur: insanlar hataları ve ramak kala olayları gizlemeyi öğrenir; çünkü bunları bildirmek cezalandırılır. Risk liderlik için görünmez hâle gelir ve sistem, kendisini neyin az kalsın çökertecek olduğunu hiç öğrenmez.
Suçsuz bir kültür farklı bir küme sorar: bu nasıl oldu, neden mümkündü, hangi kontrol eksikti? Bu sorular kişide değil, sistemde biter. Yanıt dikkatsiz bir insan yerine eksik bir koruma bandı olduğu için, aksiyon maddesi de inşa edebileceğiniz bir koruma bandı olur. İnsanlar daha çok paylaşır; çünkü paylaşım, bir etiketle cezalandırılmak yerine bir düzeltmeyle ödüllendirilir. Bu, kod incelemesini iğnelemeden bilgi paylaşımına dönüştüren psikolojik güvenin aynısıdır.
İki soru kümesi, kendini besleyen iki döngü oluşturur. Biri organizasyonu bilgiden yoksun bırakır; diğeri besler.
Her iki döngüyü bir arada tutan yeniden çerçeveleme kısadır: kim hata yaptı diye sormayız; ne hata yaptı diye sorarız. Bundan sonrası, bu cümleye sadık kalmanın mekaniğidir.
Postmortem Neye Yarar
Bir postmortem, kimin vardiyada olduğunun kaydı değildir. Bir olayın yazılı kaydıdır: etkisi, kurtarma için yapılanlar, katkı sağlayan faktörler ve tekrarı önleyen takip işi. Google SRE kitabı amaç konusunda nettir: postmortem yazmak bir ceza değildir, tüm organizasyon için bir öğrenme fırsatıdır. Çıktı, kapanan bir hüküm değil, hayata geçen bir öğrenmedir.
Bu yeniden çerçevelemenin pratik bir testi var. Postmortem’iniz sahibi ve son tarihi olan, izlenen bir sistem değişikliği üretiyorsa, öğrenme üretmiştir. “Mühendis daha dikkatli olacak” gibi bir cümle üretiyorsa, düzeltici aksiyon kostümü giymiş bir suçlama üretmiştir. Birincisi üç ay sonra yeniden okunduğunda hâlâ ayaktadır; ikincisi bir sonraki günlük toplantıya kadar unutulur.
Kıdemli katılımın önemi göründüğünden büyüktür. Bir direktör suçsuz bir incelemede oturup “kim onayladı” yerine “hangi kontrol eksikti” diye sorduğunda, oda kuralların gerçek olduğunu öğrenir. Tersi de aynı hızda olur: bir liderin bir incelemede tek bir isim avlaması, aylarca beyan edilmiş politikayı yıkar.
İnsan Hatası Sebep Değil, Belirtidir
Tüm modelin üzerine oturduğu ilke budur. İnsan hatası bir olayın asla kök sebebi değildir; sistemin derinindeki bir şeyin belirtisidir. Hata, sistemin neye izin verdiğidir; sistemin neden kırılgan olduğu değildir.
Sidney Dekker bunu Eski Görüş ile Yeni Görüş olarak çerçeveler. Eski Görüş insan hatasını sorunun sebebi olarak ele alır, bu yüzden çözüm insanı düzeltmektir: yeniden eğitmek, bir onay kapısı eklemek, kılavuza bir uyarı yazmak. Yeni Görüş insan hatasını, sistemde zaten var olan bir sorunun belirtisi olarak ele alır, bu yüzden çözüm hatayı kolay ve sonuçlarını büyük yapan sistemi düzeltmektir. İki görüş aynı olaya bakar ve zıt aksiyon maddelerine ulaşır.
John Allspaw buna işlevsel bir kaldıraç verir: “ikinci hikâye”. Her olayın bir ilk hikâyesi vardır: yüzeyde ne olduğu. Bir de ikinci hikâyesi vardır: o eylemin, kişinin bildikleri ve gördükleri göz önüne alındığında, o anda neden mantıklı geldiği. Asıl içgörü şudur. Eylem, kişi onu yaptığında ona mantıklı gelmişti; çünkü mantıklı gelmeseydi onu yapmazdı. Dolayısıyla verimli soru asla “neden dikkatsizdiler” değildir. “Yanlış yolu, kişinin durduğu yerden doğru yol gibi gösteren neydi” sorusudur. Bu soru doğrudan sistemi gösterir: kafa karıştıran panel, eksik onay, birbirine aynı görünen iki ortam.
Karşı-olgusal (counterfactual) akıl yürütmenin bir tuzak olmasının nedeni de budur. “Uyarıyı fark etmeliydiler” var olmayan bir dünyayı tarif eder. Var olan dünyada uyarı, kırk uyarıdan biriydi ya da kimsenin izlemediği bir kanala yönlendirilmişti. Şimdi sahip olduğunuz her şeyi bilen sürümü değil, yanlış eylemi makul kılan koşulları analiz edin.
Sağlıklı Olay Analizinin Beş Katmanı
Suçsuz bir analiz, olayın yüzeyinden ona izin veren sistem boşluğuna doğru iner. Her katman, üstündekinden daha derin bir sorudur. Çoğu suçlayan kültür ikinci katmanda, ilk hamleyi yapan insanda durur. Asıl iş, devam etmektir.
Somut bir vakayı katmanlardan geçirelim. Olay, bir dağıtımın üretim tablosunu düşürmesidir. Tetikleyici, bir mühendisin yanlış ortama karşı bir migration çalıştırmasıdır. Suçlayan bir kültür “mühendis yanlış migration’ı çalıştırdı” yazar ve durur. Suçsuz bir analiz bunu sonuç değil, tetikleyici olarak ele alır ve inmeye devam eder. Katkı sağlayan faktörler: staging ve üretim konsolları görsel olarak aynıydı ve kimlik bilgileri tek bir terminal oturumunda paylaşılmıştı. Kontrol hatası: bir onay istemi ve ortamlar arasında ayrı hesap sınırı yoktu. Sistem boşluğu: ortam izolasyonunu kimse sahiplenmemişti, bu yüzden koruma bandı hiç inşa edilmemişti. Düzeltme dört ve beşinci katmanlarda yaşar. Mühendisi yeniden eğitmek bunların hiçbirini düzeltmez; bir sonraki mühendis aynı tuzağı miras alır.
James Reason’ın İsviçre Peyniri Modeli bu inişin arkasındaki resimdir. Savunmalar peynir dilimleridir, her birinde delikler vardır; delikler zamanla yer değiştiren ve boyut değiştiren zayıflıklardır. Bir olay yalnızca birkaç dilimdeki delikler hizalanıp bir hata baştan sona geçtiğinde olur. Reason, keskin uçtaki güvensiz eylem olan aktif hatalar ile yetersiz araçlar, belirsiz sahiplik veya paylaşımı cezalandıran bir kültür gibi uykuda olan sistemsel zayıflıklar olan gizli koşulları ayırır. (Burada belirsiz sahiplik, tam da bu tür gizli bir koşuldur.) Gizli koşullar, bir aktif hata içlerinden geçene kadar uzun süre zararsız durabilir. Suçsuz bir postmortem, gizli koşulların avıdır; çünkü kalıcı olarak kapatabileceğiniz delikler onlardır.
Düşman: Aşırı Atıf
Çoğu olay incelemesini sessizce yenen şey aşırı atıftır (over-attribution): çok faktörlü bir sistem hatasını tek bir insan kararına indirgemek. Aşırı atıf titizlik gibi hissettirir. Temiz bir anlatı, net bir sahip ve hızlı bir kapanış üretir. Aynı zamanda karmaşık sistemlerin nasıl çöktüğü konusunda yanlıştır ve bu yanlışlık size bir sonraki kesintiye mal olur.
Burada alanın en tartışmalı aracında bir taraf tutuyorum: Beş Neden (Five Whys). Atlassian’ın kendi suçsuz postmortem rehberi, “gerçek bir kök sebebe” ulaşana kadar nedensel zinciri yürümek için Beş Neden’i kullanmayı önerir. İlginç gerilim budur; çünkü suçsuz kültürün bir savunucusu, suçsuzluk savunucularının reddettiği tam o aracı önermektedir. Allspaw’ın “The Infinite Hows” ve Salesforce’un “How, Not Why” yazıları buna karşı argümanı kurar ve genel olarak bu argüman yazılım sistemleri için doğrudur.
Beş Neden’in üç sorunu vardır. Doğrusaldır: tek bir zinciri geriye doğru yürür, oysa gerçek olaylarda aynı anda etkileşen birden çok katkı sağlayan faktör vardır. Tekrarlanabilir değildir: aynı olayı üç farklı kolaylaştırıcıya verin, üç farklı “kök sebep” alırsınız; çünkü her “neden” bir ebeveyni seçip gerisini atar. Ve indirgemecidir: sıkı bağlı bir sistemin nadiren sahip olduğu tek bir kök vaat eder. Sağlık alanında kök sebep analizine yönelik hakemli bir eleştiri de aynı noktaya iner; tekil “kök sebep” çerçevesi araştırmacıları tatmin edici tek bir hikâyeye ve sistemden uzağa iter.
Önerim, “neden” yerine “nasıl”ı, tekil “kök sebep” yerine “katkı sağlayan faktörler”i tercih etmektir. Hatanın nasıl mümkün olduğunu sorun; bu, birkaç koşulu yüzeye çıkarır ve sizi onları haritalamaya davet eder. “Neden” sizi tek bir kişiye götürür; “nasıl” sizi bir sistem koşulları kümesine götürür. Olay aracınız tek bir “kök sebep” alanıyla geliyorsa, onu tek bir sebebin var olduğu iddiası olarak değil, birincil katkı sağlayan faktörün etiketi olarak ele alın.
Charles Perrow’un “Normal Kazalar”ı burada liderlik için dürüst bir destek noktasıdır. Hem etkileşimsel olarak karmaşık hem de sıkı bağlı sistemlerde bazı kazalar normaldir: ihmalin sonucu değil, sistemin doğasında olan bir özelliktir. Etkileşimsel karmaşıklık tetikleyicidir; sıkı bağlılık ise küçük bir hatayı büyük bir hataya yayar. Liderlik mesajı rahatsız edici ve doğrudur: karmaşık bir sistemde sıfır olaya suçlayarak ulaşamazsınız. Yalnızca sistemi daha küçük çökecek ve daha hızlı toparlanacak şekilde tasarlayabilirsiniz.
Güçlü Organizasyonlar Neyi Farklı Yapar
Geçiş, insanları optimize etmekten sistemi optimize etmeye ve cezadan düzeltmeye doğrudur. Güçlü olay kültürleri birkaç somut alışkanlığı paylaşır.
Aksiyon maddelerini insanlara değil kontrollere karşı yazarlar. Her madde bir varsayılanı, bir otomasyonu, bir koruma bandını veya bir arayüzü değiştirir; hiçbiri “daha dikkatli ol” değildir. Bu maddeleri, sahibi ve son tarihi olan diğer öncelikli işler gibi izlerler ve kapatırlar. Atlassian’ın çerçevesi açık ve doğrudur: her düzeltici aksiyonu sahibi ve son tarihi olan izlenen bir iş maddesine dönüştürmek, gerçekten iyileşen ekipleri aynı soruna tekrar tekrar çarpan ekiplerden ayıran şeydir.
Yalnızca başarısızlığı değil, başarıyı da incelerler. Erik Hollnagel’in Safety-II ayrımı yararlıdır: Safety-I neyin yanlış gittiğini en aza indirmeye çalışır, Safety-II ise işlerin neden genellikle doğru gittiğini inceler. İşler doğru gider; çünkü insanlar gerçek koşullara mantıklı uyarlamalar yapar; kılavuzdaki “hayal edilen iş”ten farklı olan “yapılan iş” budur. Postmortem için çıkarım, normal operasyonu da incelemektir; çünkü gerçek dayanıklılığınız oradadır ve kılavuzunuzun sessizce güncelliğini yitirdiği yer de orasıdır.
Bir uyarıyla birlikte öğrenme hızını izlerler. Sistem değişikliği üreten postmortem’lerin oranını izlemeyi yararlı buluyorum; incelemelerin gerçek iş yapıp yapmadığına dair el yapımı bir sinyal olarak. Bunun standartlaştırılmış bir sektör metriği olmadığını dürüstçe söyleyin; bu yerel bir göstergedir, atıf yapabileceğiniz bir ölçüt değil. Önemli olan yöndür: bir değişiklik gönderen postmortem sisteme bir şey öğretti, göndermeyen ise öğretmedi.
İzlemeye değer birkaç metrik var, hiçbiri oynanmaya değmez. Aksiyon maddesi tamamlanma oranı ve medyan kapanma süresi döngünün kapanıp kapanmadığını gösterir. Tekrar eden olay oranı, sebepleri mi yoksa belirtileri mi düzelttiğinizi gösterir. Tespit etme süresi ve toparlanma süresi, savunmalarınızın ve toparlanmanızın iyileşip iyileşmediğini, bir gurur sayısı olarak değil bir trend olarak gösterir. En sezgilere aykırı olanı ramak kala bildirim oranıdır: sağlıklı bir suçsuz kültürde bu artmalıdır; çünkü insanlar az kalsın olacak olanı yüzeye çıkarmakta kendilerini güvende hisseder.
Kopyalayabileceğiniz Bir Postmortem Şablonu
Bir postmortem’in, analizin sistemi sessizce atlamaması için sabit bir iskelete ihtiyacı vardır. Aşağıdaki bölümler asgari olandır. Sonuncusu en önemlisidir ve asla boş olmamalıdır.
# Postmortem: [kısa olay başlığı]
## Özet
Bir iki cümle: ne bozuldu, kim etkilendi, ne kadar sürdü.
## Ne oldu (zaman çizelgesi)
Sırayla gerçek olay zinciri. Müdahale edenlerin o an görebildiği
şey üzerinden, her adımda neyin bilindiği. Yorum yok, suçlama
yok, geri görüş (hindsight) yok.
## Etki
Etkilenen kullanıcılar, süre, kapsam ve ölçülebilir herhangi bir
etki. Sıfatlar değil, birimler ve sayılar.
## Tespit boşluğu
Öğrenene kadar ne kadar sürdü. Neden daha erken değil? Hangi
sinyal eksikti, geç geldi ya da kimsenin izlemediği bir yere yönlendi.
## Kontrol boşluğu
Hangi koruma bandı çalışmadı ya da yoktu. Bunu durdurması ya da
küçültmesi gereken ama yapmayan kontrol.
## Katkı sağlayan faktörler
Hatayı mümkün kılan koşullar: süreç, araç, iletişim, sahiplik.
Birkaç tane listeleyin; tek bire indirgemeye direnin.
## Aksiyon maddeleri
Yalnızca sistem düzeltmeleri. Her madde bir kontrolü, varsayılanı,
otomasyonu ya da arayüzü değiştirir. Her birinin sahibi ve son
tarihi vardır. "Daha dikkatli ol" maddesi yok.
| Aksiyon | Sahip | Son tarih | Durum |
|---------|-------|-----------|-------|
| | | | |
## Tekrarı nasıl önleriz?
En önemli bölüm. Bu tam hatanın bir sonraki sefere imkânsız ya da
çok daha küçük olmasını neyin sağladığını ve bunu hangi aksiyon
maddesinin getirdiğini açıkça belirtin.
Şablonun neyi içermediğine dikkat edin: olaya kimin sebep olduğuna dair bir alan. Bu eksiklik kasıtlıdır. Müdahale edenler zaman çizelgesinde rolleriyle yer alır (“nöbetçi mühendis”, “dağıtım yapan ekip”), asla suç atfedilecek bir isim olarak değil. PagerDuty’nin rehberi aktörü tam olarak bu nedenle “belirsiz bir müdahale edici” olarak soyutlar; amaç, dikkati bireyde değil eylemde ve bağlamında tutmaktır.
Ne Zaman Devre Dışı Bırakılır: Suçsuzluk Sonuçsuzluk Değildir
Suçsuzluk, sorumluluğun olmaması anlamına gelmez ve bunu liderliğe öyle satmak, biri kötü niyetle davrandığı ilk anda tüm modeli reddettirir. Dürüst çerçeve Dekker’in Adil Kültür’üdür (Just Culture): çoğu hata, sistemin izin verdiği dürüst hatalardır ve birkaçı, suçsuz çerçevenin dışında kalan gerçek ihmal, pervasızlık ya da kötü niyettir. Bu çizgiyi net çekmek, modeli onaylayan kişiler için savunulabilir kılan şeydir.
Karar “cezalandır ya da affet” değildir. Ortasında bir test olan bir triyajdır.
İkame testi (substitution test) menteşedir. Test, James Reason’ın çalışmasından gelir ve Dekker’in Just Culture yaklaşımıyla yaygınlaştı. Aynı bilgiye ve aynı baskılara sahip başka bir yetkin kişi, büyük olasılıkla aynı seçimi yapar mıydı? Evetse, sorun kişi değil durumdur ve suçsuz analizde kalırsınız. Makul bir akran açıkça yapmazdıysa, gerçek pervasızlığa doğru kaymışsınız demektir ve sorumluluk yolu geçerli olur. O zaman bile sistem öğrenmesi yine de gerçekleşir; bir sorumluluk vakası, organizasyonu koşulları düzeltmekten muaf tutmaz.
PagerDuty ilgili, dürüst bir noktaya değinir: mükemmel suçsuzluk gerçekçi değildir; çünkü insanın atıf yönündeki önyargısı emirle yok olmaz. Kimsenin tam olarak koruyamayacağı bir saflık iddiası yerine, önyargıyı adlandırarak odanın ona direnmesini sağlayan “suçlama farkındalığını” tercih ederler. Suçsuzluğu, ulaştığınız bir durum değil, uyguladığınız bir disiplin olarak ele alın.
Kısa Bir Örnek
Bir projede, bir arka plan işi küçük bir kayıt kümesini sessizce iki kez ücretlendirdi. İlk inceleme, değişikliği birleştiren mühendisi buldu, test kapsamının “bunu yakalaması gerektiğini” not etti ve daha fazla test ekleme notuyla kapandı. Aynı tür hata birkaç sürüm döngüsü içinde, farklı bir mühendisten ve farklı bir kod yolundan geri döndü.
İkinci seferinde inceleme bir isimde durmak yerine katmanlardan aşağı indi. Katkı sağlayan faktörler şunlardı: işin idempotency garantisi ve kuru çalıştırma (dry-run) modu yoktu ve iki servis ortak bir kilit olmadan aynı kaydı yazabiliyordu. Aksiyon maddeleri sistemi değiştirdi: işlem üzerinde bir idempotency anahtarı, işte bir dry-run bayrağı ve yinelenen yazmalar için bir alarm. O tür hata geri gelmedi. Fark, daha iyi bir mühendis değildi. İkinci incelemenin insanı belirti olarak ele alıp boşluğu aramaya gitmesiydi.
Yaygın Tuzaklar
Tekrar tekrar ortaya çıkan birkaç hata modeli, her biri somut bir çözümle:
- Analizi bir insanda durdurmak. Tetikleyici bir kişidir; sebep bir sistem boşluğudur. İsmin ötesinde eksik kontrole doğru inmeye devam edin.
- “Yeniden eğit” ya da “daha dikkatli ol” diyen aksiyon maddeleri. Her maddenin bir kontrolü, varsayılanı, otomasyonu ya da arayüzü değiştirmesini şart koşun. Yalnızca bir insandan daha çok çabalamasını istiyorsa, aksiyon maddesi değildir.
- Karşı-olgusal akıl yürütme. “Fark etmeliydiler” var olmayan bir dünyayı tarif eder. Yanlış yolu o anda makul kılan şeyi analiz edin.
- Zaman çizelgesinde geri görüş önyargısı. Zaman çizelgesini şimdi bildiğinizden değil, o an bilinenden kurun. Müdahale edenlerin elinde sizin özetiniz yoktu.
- Suçsuzluğu sonuçsuzluk sanmak. İhmal ve kötü niyet için açık bir Adil Kültür çizgisiyle eşleştirin; böylece liderlik modele güvenir.
- Sahibi ve son tarihi olmayan aksiyon maddeleri. İzlenmeyen bir düzeltici aksiyon bir dilektir. Onu diğer öncelikli işler gibi izleyin ve kapatın.
Sonuç
Suçsuz varsayım, olayların ezici çoğunluğu için geçerlidir: sistemin hataya izin verdiğini varsayın, beş katmandan inin ve aksiyon maddelerini kişilere değil kontrollere karşı yazın. Adil Kültür devre dışı bırakmasına yalnızca yetkin bir akranın açıkça aynı seçimi yapmayacağı durumda başvurun; bu sınır, “suçsuzluğu” dürüst tutan ve liderliği yanınızda tutan şeydir. “Neden” yerine “nasıl”ı, tekil “kök sebep” yerine “katkı sağlayan faktörler”i tercih edin ve bir postmortem’i bir sistem değişikliği gönderip göndermediğine göre değerlendirin.
Bunu okuduktan sonra tek bir şey yapacaksanız, bir sonraki olay incelemenizin başladığı soruyu değiştirin. “Bunu kim yaptı”yı “hangi kontrol eksikti” ile değiştirin ve analizi oradan şablonun taşımasına izin verin. Bu kültür değişiminin tekrar eden olay oranınızda görünüp görünmeyeceği önümüzdeki birkaç çeyrekte ölçülecek şeydir; ilke kalıcıdır, kanıt yereldir.
Kaynaklar
- Google SRE Book — Postmortem Culture: Learning from Failure (Ch. 15) - Suçsuz postmortem’in kanonik tanımı; “ceza değil, öğrenme fırsatı”; üst yönetimin rolü.
- Google SRE Workbook — Postmortem Culture - Şablonlar ve benimseme taktikleriyle güncellenmiş, daha pratik tamamlayıcı bölüm.
- Etsy / John Allspaw — “Blameless PostMortems and a Just Culture” - İkinci hikâye, adil kültür ve yerel akılcılık üzerine temel sektör makalesi.
- John Allspaw — “The Infinite Hows (or, the Dangers of the Five Whys)” - Doğrusal kök sebep analizine karşı argüman; “neden” yerine “nasıl”ı tercih edin.
- Sidney Dekker — Just Culture - Eski Görüş ile Yeni Görüş; güvenlik ve sorumluluk dengesi; ikame testi.
- Just Culture (Dekker) — özet - Kitabın temel argümanlarının erişilebilir ikincil özeti.
- Swiss Cheese Model — Wikipedia - James Reason’ın katmanlı savunma modeli; aktif hatalar ile gizli koşullar.
- Normal Accidents — Wikipedia - Perrow’un etkileşimsel karmaşıklık ve sıkı bağlılığı; bazı hataların neden “normal” olduğu.
- Erik Hollnagel — Safety-I and Safety-II - Dayanıklılık mühendisliği; işlerin neden doğru gittiğini incelemek; yapılan iş ile hayal edilen iş.
- Atlassian — How to run a blameless postmortem - Pratik şablon ve aksiyon-maddeleri-izlenen-iş yaklaşımı; Beş Neden önerisinin de geldiği yer.
- PagerDuty — The Blameless Postmortem - “Ne ve nasıl, neden ve kim değil”; belirsiz bir müdahale ediciye soyutlama; “suçlama farkındalığı”.
- Salesforce Engineering — “How, Not Why” - Beş Neden eleştirisinin satıcıdan bağımsız bir pekiştirmesi.
- BMJ Quality & Safety — “The problem with root cause analysis” - Kök sebep analizinin indirgemeci tek-sebep görüşünü teşvik ettiğine dair hakemli bir eleştiri.
- dastergon/postmortem-templates (GitHub) - Kendi iskeletiniz için uyarlayabileceğiniz açık bir gerçek postmortem şablonları koleksiyonu.
İlgili yazılar
Yazılım takımlarında çatışmayı erken fark etme, yönetme ve çözme için topluluk testinden geçmiş pratik framework'ler ve erken uyarı sistemleri.
Yüksek riskli üretim ortamlarında bildirim sistemi hatalarından edinilen gerçek dünya debugging teknikleri, izleme stratejileri ve dersler
Olgun bir mühendislik ekibinin sahiplendiği belgelere bir rehber: onboarding, takım anlaşmaları, Definition of Done, nöbet, bilgi aktarımı ve her birini iyi yapan şey.
Yapay zeka uygulamanın çoğunu üstlenirken soru hangi çevik çerçeve değil, dört geri besleme döngüsüdür; AI destekli ekiplerde tören değil döngüleri ayarlayın.
Kültürel yanlış anlaşılmalar global yazılım takımlarını sessizce başarısızlığa sürükler; geri bildirim, toplantı ve eskalasyonu kültüre uyarlamanın pratik çerçeveleri.