pengembangan-web-mp-pd.com

Kecelakaan administrator sistem terbaik

Saya mencari cerita lucu tentang kecelakaan administrator sistem yang Anda miliki. Menghapus email CEO, memformat hard drive yang salah, dll.

Saya akan menambahkan cerita saya sendiri sebagai jawaban.

87
Alan H

Saya senang menemukan perbedaan antara perintah "killall" linux (membunuh semua proses yang cocok dengan nama yang ditentukan, berguna untuk menghentikan zombie) dan perintah "killall" solaris (membunuh semua proses dan menghentikan sistem, berguna untuk menghentikan server produksi di tengah jam sibuk dan membuat semua rekan kerja Anda menertawakan Anda selama seminggu).

133
Tim Howland

Saya bertanggung jawab atas proxy web perusahaan kami yang pada saat itu adalah produk Netscape. Saat bermain-main dalam bentuk admin (itu adalah antarmuka berbasis web) ada tombol besar (dan saya bersumpah itu merah) yang mengatakan Hapus Database Pengguna. Tidak masalah, pikirku. Mari kita lihat opsi apa yang diberikannya pada saya ketika saya menemukannya. Tentunya akan ada Konfirmasi konfirmasi jika tidak ada opsi.

Ya, tidak ada konfirmasi. Tidak ada opsi. Tidak ada lagi pengguna.

Jadi, pergi ke Tuan Solaris Sysadmin dan berkata bahwa saya sangat membutuhkan pemulihan dari kaset yang dia jawab, "Saya tidak mendukung kotak itu."

"Eh, ayo lagi," balasku.

"Aku tidak mencadangkan kotak itu. Ini ada dalam daftar hal untuk ditambahkan ke rotasi cadangan tapi aku belum sempat melakukannya."

"Server ini sudah berproduksi selama hampir 8 bulan!" Aku berteriak.

mengangkat bahu , jawabnya. "Maaf."

73
squillman

Bertahun-tahun yang lalu perusahaan tempat saya bekerja memiliki klien yang menjalankan backup malam dari NT 4.0 Server mereka ke Jaz drive (seperti disk Zip berkapasitas tinggi).

Kami menyiapkan file batch, yang dijalankan sebagai pekerjaan terjadwal dalam semalam. Setiap pagi mereka mengumpulkan disk malam terakhir dari drive, dan sebelum mereka pergi di malam hari mereka akan memasukkan disk berikutnya dalam urutan.

Lagi pula, file batch terlihat seperti ini (drive Jaz adalah drive F:) ...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

Lagi pula, suatu malam mereka lupa memasukkan disk. Perubahan ke drive F: gagal (tidak ada disk dalam drive), dan file batch terus berjalan. Direktori kerja default untuk file batch? C :. Pertama kali saya melihat rutinitas cadangan hancurkan server yang dicadangkannya.

Saya belajar sedikit tentang sysadminning (dan penanganan pengecualian) hari itu.

Jim.

PS: Perbaikannya? "deltree/y F:\*. *".

66
Jim OHalloran

root @ dbhost # find/-nama inti -exec rm -f {} \;

Saya: "Anda tidak bisa masuk? OK. Apa nama DB?"

Cu: "Inti."

Saya: "Oh."

61
Dave

Saya suka cara semua orang memenuhi syarat cerita mereka dengan "ketika saya muda/hijau" seolah-olah mereka tidak akan pernah melakukannya lagi. Kecelakaan dapat terjadi bahkan pada pro yang paling berpengalaman sekalipun.

Momen terburuk saya sendiri sangat buruk sehingga saya masih berdebar memikirkannya ...

Kami memiliki SAN dengan data produksi di atasnya. Sangat penting bagi perusahaan. "Mentor" saya memutuskan untuk memperpanjang partisi untuk membebaskan beberapa ruang disk. Bisakah Anda melihat ke mana arahnya? Ia berkata bahwa perangkat lunak SAN dapat melakukan ini secara langsung, dalam jam produksi dan tidak seorang pun akan menyadarinya. Lonceng alarm seharusnya sudah mulai berdering, tetapi secara diam-diam diam. Dia berkata telah melakukan itu " kali sebelum "tanpa masalah. Tapi ada satu hal - dia menyuruh saya untuk mengklik tombol yang mengatakan" apakah Anda yakin? "! Karena saya masih baru di perusahaan saya berasumsi orang ini tahu apa yang dia bicarakan. Kesalahan besar. kabar baiknya adalah bahwa LUN diperpanjang. Berita buruknya adalah ... yah saya tahu ada berita buruk ketika saya mulai melihat kesalahan penulisan disk pada kotak Windows.

Saya senang saya memakai celana coklat.

Kami harus menjelaskan mengapa 1TB data hilang saat makan siang. Itu adalah hari yang sangat, sangat buruk.

Sebenarnya ini adalah prinsip yang baik - sebelum Anda melakukan sesuatu yang Anda ragukan, bayangkan harus menjelaskan kepada manajemen jika ada yang salah. Jika Anda tidak bisa memikirkan jawaban yang baik untuk menjelaskan tindakan Anda maka jangan lakukan itu.

60
PowerApp101

Nagi mem-ping kami pada suatu pagi ketika jam kerja mulai mengatakan bahwa itu tidak dapat terhubung ke server yang tidak penting. Ok, mendaki ke ruang server. Ini adalah server lama, Dell 1650 dibeli pada '02, dan kami tahu bahwa 1650-an telah mengalami masalah perangkat keras. PFY menusuk tombol daya. Tidak ada. Tekan lagi, dan tahan selama lima detik untuk 'memaksa daya' ... yang menimpa perlindungan kesalahan BMC, karena tanpa DRAC tidak ada cara untuk memeriksa log BMC tanpa memiliki daya pada sasis.

Mesin memulai POST, dan kemudian mati lagi. Aku berdiri di atasnya dan berkata, "Aku mencium bau asap." Kami menarik server keluar pada Rails-nya, dan salah satu catu daya terasa hangat, sehingga PFY menariknya dan akan menutup kembali kotaknya. Saya berkata, "Tidak, itu bukan asap catu daya, itu asap motherboard."

Kami membuka kasing lagi dan mencari sumber bau yang membakar. Ternyata kumparan induktor dan kapasitor sesuatu meniup regulator tegangan pada motherboard, dan menyemprotkan tembaga cair dan kapasitor goop di segala sesuatu, korslet banyak barang dan pada dasarnya membuat kekacauan besar.

Bagian terburuk bagi saya adalah mengakui bahwa saya telah merokok perangkat keras yang cukup untuk mengenali perbedaan antara bau motherboard yang terbakar dan catu daya yang terbakar.

54
Karl Katzke

Tiga hari yang lalu (serius) Saya login ke server sekolah dari jarak jauh, menginstal Paket Layanan 2 pada file server Windows Server 2008.

Saya memutuskan untuk menjadwalkan reboot yang diperlukan untuk larut malam, ketika para guru tidak akan login untuk menyelesaikan rapor akhir tahun mereka. Saya mengetik sesuatu seperti:

 pada 23:59 "shutdown -r -t 0" 

... yang mungkin bekerja dengan baik.

Tapi kemudian aku menebak diriku sendiri. Apakah sintaks 'shutdown' saya benar? Saya mencoba melihat bantuan penggunaan dengan mengetik

 shutdown/jam 

... dan langsung kehilangan koneksi RDP saya. Panik, saya menekan Google untuk sintaks. Pencarian cepat mengungkapkan bahwa versi shutdown Server 2008 termasuk switch/jam, yang (seperti yang Anda duga) hibernasi mesin.

Guru mulai memanggil saya dalam beberapa menit untuk melaporkan bahwa mereka tidak bisa lagi membuka atau menyimpan kartu laporan yang sedang mereka kerjakan. Karena saya berada di luar kantor dan ruang server terkunci, saya harus memanggil kepala sekolah secara langsung dan menuntunnya melalui proses menyalakan kembali mesin.

Hari ini saya membawa kue buatan sendiri untuk semua orang sebagai bentuk permintaan maaf.

47
Brent D

Dalam pekerjaan sebelumnya, kami memiliki sistem homegrown yang bagus yang mencatat dan mengarsipkan setiap bagian surat yang masuk, pergi atau tinggal di dalam perusahaan.

Hancurkan seluruh kotak surat Anda? Tidak masalah! Mencari selembar surat yang dikirim seseorang kepada Anda seminggu/bulan/tahun yang lalu tetapi Anda tidak ingat siapa yang mengirimnya atau apa topiknya? Tidak masalah! Kami hanya akan mengembalikan semuanya mulai Februari untuk Anda ke folder khusus.

Pada titik tertentu, perlu datang bagi CEO perusahaan untuk memantau pengiriman surat antara pesaing dan tenaga penjualan internal yang dicurigai. Jadi kami menyiapkan skrip daripada berlari setiap malam dan mengirimkan surat yang relevan dari hari sebelumnya ke CEO. Tidak masalah!

Sekitar satu bulan kemudian, berita tentang masalah ganda-plus yang mendesak muncul dari tempat tinggi. Tampaknya ketika CEO sedang membaca daftar surat yang dikirim ke $ OTHERCOMPANY, ia menemukan yang ini:

To: [email protected]$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

Tentu saja, CEO menjadi orang yang penting dan semuanya, dia terlalu sibuk untuk mengklik semua dialog "Kirim Tanda Terima Baca" di Outlook dan telah mengonfigurasi kliennya untuk mengirim semuanya. Salah satu pesan yang ditangkap oleh filter pemantauan memiliki set permintaan penerimaan-baca. Coba tebak apa yang dilakukan Outlook? Tentu saja mengganggu pemantauan 'rahasia'.

Tugas kami berikutnya: menambahkan aturan ke filter surat untuk memblokir tanda terima baca yang keluar dari CEO ke perusahaan itu. Ya, itu cara termudah. :)

37
MikeyB

Ahhh, kakiku sekitar 10 tahun yang lalu, ketika kakiku masih basah. Saya senang menginstal cadangan baterai di semua komputer programmer. Mereka juga ingin perangkat lunak dimuat untuk memperingatkan pemadaman listrik dan dimatikan dengan benar.

Jadi saya mengaturnya di komputer saya untuk menguji semuanya terlebih dahulu tentu saja dan memastikan semuanya bekerja. Jadi saya mencabut kabel listrik dan pesan muncul di layar saya. "Daya eksternal terputus, mulailah mematikan sistem".

Jadi saya berpikir, Hei keren, itu berhasil. Tetapi untuk beberapa alasan aneh, saya bahkan tidak ingat, itu mengirim pesan itu sebagai pesan jaringan sehingga semua 200+ komputer di perusahaan mendapat pesan itu, di mana 100+ pengguna di mana programmer.

Ya, bicaralah tentang orang gila !!

Aku menundukkan kepalaku di tempat itu untuk sementara waktu!

36
jherlitz

Saya sering menggunakan perintah "sys-unconfig" pada mesin Solaris untuk mereset layanan Nama mesin, I.P. alamat, dan root password. Saya menggunakan sistem pengguna dan saya masuk ke server instal gedung dan mencari sesuatu (sebagai root), kemudian lupa bahwa saya telah masuk ke komputer lain (non deskriptif "#" Prompt) Saya menjalankan perintah "sys-unconfig".

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#

Pesan "koneksi ditutup" perlahan berubah menjadi panik ... mesin apa yang saya masuki ketika saya menjalankan perintah itu.

Bagian terburuk dari ini bukan waktu sulit rekan kerja saya memberi saya, itu adalah saya melakukan hal yang sama sebulan kemudian.

35
Alan H

Saya punya yang cukup bagus. Memang, itu sebelum waktu saya sebagai sysadmin, tetapi masih terkait teknologi jadi saya pikir saya akan menambahkannya.

Kembali pada hari itu, saya bekerja sebagai teknologi satcom/wideband untuk USAF. Setelah baru saja lulus sekolah teknik, saya menemukan diri saya ditempatkan di Korea Selatan. Tidak lama setelah tiba di stasiun, muncul peluang untuk melakukan perjalanan ke selatan bersama "orang-orang besar" yang sudah lama berada di sana dan benar-benar bekerja pada beberapa peralatan dunia nyata, (yaitu, 'produksi').

Saya turun bersama para kru dan sebagai seorang anak muda yang bersemangat dan teknologis, menggoncang bagian itu, cukup bersemangat melihat prospek mendapatkan peralatan yang sebenarnya yang melewati suara militer LANGSUNG dan lalu lintas data.

Untuk memulai saya dengan lambat, mereka menyerahkan saya sebuah manual, menoleh ke bagian pemeliharaan preventif dan mengarahkan saya ke arah empat rak yang diisi dengan beberapa multiplexer digital besar. Peralatannya cukup mudah, kami sudah membahas peralatan yang sama di sekolah teknologi.

Halaman pertama buku panduan dibaca; "Terapkan daya ke multiplexer ditigal. Putar kedua sakelar belakang ke posisi ON dan tunggu peralatan menyala, lalu mulailah tes." Saya melihat ke atas, dan sudah ada kekuatan yang DITERAPKAN!

Saya berada dalam kesulitan pasti. Tidak tahu bagaimana melanjutkan, saya melakukan yang terbaik, 'Ummmm .. Agak hilang di sini' melihat senior.

Dia menatapku dan tertawa, "Tidak, tidak, tidak apa-apa. Kau bisa mengabaikan bagian daftar itu." Kemudian, ketika dia memperhatikan raut wajahku, (karena kita diajar di sekolah untuk TIDAK PERNAH, PERNAH mengabaikan bagian daftar periksa, dan pasti ada kematian dan kehancuran jika ada yang melakukannya) dia menaruh perhatian serius pada wajahnya. wajah dan berkata, "Abaikan HANYA bagian itu! Ikuti sisanya, ke surat itu!"

Dengan patuh, saya menjalankan instruksi multi-langkah PM, senang sebagai seorang kerang dan bangga bahwa mereka membiarkan teknologi tingkat rendah, (meskipun pintar) melakukan pekerjaan penting ini.

Di suatu tempat antara daftar pemeliharaan preventatif kelima dan keenam pada multiplexer besar ini saya mulai memperhatikan peningkatan tingkat aktivitas di sekitar saya. Telepon berdering, orang-orang bergerak cepat. Penampilan aneh dipertukarkan.

Akhirnya, sekelompok orang berlari ke arah saya, dipimpin oleh salah satu teknisi senior yang telah menjatuhkan saya.

"Hei! Kami melihat pemadaman BESAR dalam lalu lintas data, dan kami telah mengisolasi/melacak jalan kembali ke rak yang sedang Anda kerjakan! Apakah Anda melihat ada yang aneh .."

(Pada saat itu ia terputus oleh salah satu dari pemecah masalah yang telah membuat jalan ke grup multiplexer pertama yang saya telah melakukan PMs.)

"Kacang KUDUS! MEREKA MATI! DIA TELAH MATI !!"

Dalam waktu singkat, saya menyaksikan ketika mereka dengan tergesa-gesa menjalankan langkah pertama dalam manual, "Putar kedua saklar belakang ke posisi ON ..." Ketika teknologi senior itu selesai, dia mendatangi saya dan dengan ragu bertanya apa yang saya pikirkan dari, dengan mematikan peralatan penting.

Takut dengan akalku, aku menyerahkan daftar periksa yang aku ikuti, bersumpah bahwa aku tidak menyimpang sama sekali. Bahwa saya telah mengikutinya, 'ke surat' seperti yang dia perintahkan.

Setelah beberapa saat, dia tertawa dan menunjukkan di mana masalahnya.

Dalam manual, langkah FINAL dalam daftar periksa pemeliharaan preventif adalah:

"Rekam pembacaan probe akhir, bersihkan panel depan, singkirkan semua debu dan partikel, kemudian putar kedua sakelar daya belakang ke posisi OFF."

:)

27
Greg Meehan

Saya memuat ulang sistem untuk seseorang, dan selama proses pencadangan manual saya mengajukan pertanyaan kepadanya, "Apakah Anda memiliki program lain yang Anda gunakan?" dan "Apakah ada hal penting yang Anda lakukan di komputer?"

Dia berkata "tidak" BEBERAPA kali.

Saya yakin dan memformat drive.

Sekitar 30 menit kemudian dia berkata "oh my god" dan meletakkan kedua tangan di kepalanya.

Ternyata dia telah mengerjakan naskah buku selama lebih dari 10 TAHUN dalam program khusus. Ini kembali ketika program yang digunakan untuk menyimpan data pengguna dalam direktori file programnya dan saya melewatkannya.

Whhhhooooops.

Dia tidak marah pada saya, tetapi itu adalah perasaan yang serius.

26
MathewC

Ini semacam kecelakaan sysadmin .. sejauh sysadmin kadang-kadang harus secara fisik mengangkut sejumlah besar mesin dari titik A ke titik B (di mana A dan B tampaknya selalu dipisahkan oleh beberapa tangga di gedung tanpa lift). Pada perjalanan ke-9 hari itu, saya berhenti untuk mengambil tiga penerbangan naik dari tingkat pemuatan ruang bawah tanah untuk mengobrol dengan seseorang yang turun, menyangga menara ukuran penuh dengan stasiun yang sedang saya rangkai di pegangan dalam tangga terbuka. dan ... yah, Anda bisa menebak ... sedikit kehilangan kendali saya pada itu. Itu jatuh langsung ke sumur dan ketika mencapai bagian bawah, eh ... tidak begitu banyak dengan fungsi untuk yang satu itu! Total bagian yang dapat diselamatkan: dua batang RAM, satu floppy drive dan satu kartu ISDN (Tuhan memberkati orang-orang teknik Hermstedt!). Segala sesuatu yang lain retak, berderak atau hancur menjadi potongan-potongan kecil.

Oleh kasih karunia Tuhan, tidak ada yang berjalan di bawahnya, yang, untungnya bagi saya, adalah bos saya yang pertama, jadi saya harus mempertahankan pekerjaan saya. Merasa sangat sakit selama satu jam atau lebih.

Moral: gravitasi selalu menang!

26
avstrallen

Favorit pribadi saya sebenarnya bukan milik saya, dan saya SANGAT senang karenanya. Lihat di sini.

23
RainyRat

Ini tidak terjadi pada saya, tapi ...

Saya bekerja di sebuah perusahaan yang membuat perangkat lunak yang berjalan pada mesin Linux yang disediakan oleh klien. Kami pada dasarnya akan 'mengambil alih' mesin-mesin itu, mengonfigurasinya sepenuhnya untuk spesifikasi kami, dan melakukan semua manajemen dan pemantauan. Pada dasarnya, kami adalah tim yang terdiri dari 10-15 sysadmin, mengelola ribuan server untuk ratusan pelanggan. Kesalahan pasti terjadi.

Salah satu tim kami menemukan beberapa masalah pada server (cadangan, saya percaya), dan memutuskan bahwa ia harus menjalankan fsck di atasnya. Dia menghentikan semua layanan yang relevan, memastikan bahwa sistem telah mengambil cadangan baru-baru ini, dan kemudian menjalankan fsck, tetapi mengeluh bahwa sistem file sudah di-mount. Karena kami jauh dan tidak memiliki akses jarak jauh (DRAC, ILO, dll.), Ia tidak dapat melakukan fsck, tetapi ia cukup yakin bahwa melakukannya dengan aman dengan sistem file yang dipasang, jika Anda berhati-hati.

Dia memutuskan untuk mencobanya sendiri dengan menjalankan fsck pada partisi root-nya, dengan hasil yang dapat diprediksi - dia merusak partisi root-nya dan tidak bisa boot lagi.

Bingung, dia pergi dan berbicara dengan pemimpin tim kami. Lead mengatakan dia cukup yakin bahwa Anda tidak bisa melakukan itu, dan anggota tim berkata 'Tentu Anda bisa!', Mengambil keyboard lead, dan menunjukkan kepadanya bahwa Anda bisa - dengan menjalankan fsck pada partisi root lead. Yang benar-benar rusak partisi root HIS.

Hasil akhir? Tidak ada data pelanggan yang hilang, berkat pengujian anggota tim. Produktivitas karyawan selama dua hari hilang, tetapi nilainya jauh, jauh lebih sedikit daripada data pada mesin pelanggan. Dan sebagai catatan? Anda dapat menjalankan fsck pada drive yang dipasang, tetapi hanya untuk memverifikasi data. Bukan untuk memperbaikinya. Itu adalah kesalahan anggota tim.

-

Untuk menambahkan cerita saya sendiri, saya bekerja di perusahaan yang sama, dan mencoba mengatur ulang kata sandi pengguna. Sistem kami menolak untuk membiarkan saya menyetelnya ke kata sandi yang dia butuhkan, karena itu melacak hash kata sandi lama dan menolak untuk membiarkan Anda menggandakan kata sandi. Mekanismenya sederhana: ini memvalidasi kata sandi Anda terhadap hash terbaru dalam database.

(Dan sebagai catatan, itu perlu kata sandi lama karena itu adalah akun bersama, dan memastikan semua orang tahu kata sandi baru itu tidak praktis)

Saya memutuskan untuk masuk ke database pengguna dan menghapus catatan baru sehingga akan menggunakan yang lebih lama. Itu semua hanya SQL (menjalankan Sybase versi kuno), jadi mudah. Pertama, saya harus menemukan catatan:

SELECT * FROM users_passwords WHERE username='someuser';

Saya menemukan catatan lama yang ingin dia simpan; ada dua lagi di depannya. Saya memutuskan untuk menjadi pintar dan hanya menghapus sesuatu yang lebih baru dari catatan lama. Melihat set hasil, saya melihat bahwa kata sandi lama adalah ID # 28 dalam database, dan yang baru adalah ID #several ribu (sistem sangat sibuk). Itu sederhana, semua baris lama> 28, jadi:

DELETE FROM users_passwords WHERE id > 28;

Tidak ada yang lebih buruk daripada melakukan pemangkasan baris sederhana dan melihat '212.500 baris terpengaruh'. Untungnya, kami memiliki dua server database master (dengan ID pengguna), tetapi Sybase (setidaknya, versi kami) tidak mendukung replikasi otomatis, jadi itu tidak secara otomatis menghapus catatan lama. Itu masalah sepele untuk mendapatkan dump dari tabel users_passwords dan mengimpornya kembali. Tetap saja, 'oh f ** k!' Yang cukup besar! saat.

23
Dan Udey

Diketik kill 1 sebagai root. init dan semua anaknya meninggal. Dan semua anak mereka. dll, dll. Ups.

Apa yang saya maksudkan adalah kill %1

Setelah saya menyadari apa yang saya lakukan, saya berlari ke panel kontrol BIG mesin sortir bale wol dan menekan tombol stop darurat. Ini menghentikan mesin untuk merobek sendiri, karena saya baru saja membunuh perangkat lunak yang mengendalikannya.

22
Jason Tan

HAPUS pernyataan tanpa klausa WHERE, di database pelanggan langsung pelanggan.

22
Ian Boyd

Favorit saya yang lain:

Saat memasang komputer dan printer laser lokal pada suatu sistem, saya memiliki ide cemerlang untuk menghubungkan keduanya ke UPS komputer. Pernah mencoba mencetak ke printer laser lokal ketika dicolokkan ke UPS desktop? Nah, jika Anda tidak tahu, itu cenderung menarik semua amp ... Yang me-restart komputer ... Dan pekerjaan cetak tidak pernah selesai ...!

Pernah menerima panggilan: 'Setiap kali saya mencetak, itu restart komputer saya dan tidak mencetak !!!'?

Ups!

JFV

22
JFV

Kami berada di tengah-tengah pemadaman listrik dan melihat bahwa UPS beroperasi pada 112% dari beban yang dikonfigurasi. Ini bukan masalah karena kami menjalankan generator pada saat itu.

Jadi kami berkeliling menarik kabel daya cadangan untuk mengurangi penggunaan daya pada UPS itu (kami memiliki dua, satu jauh lebih besar dari yang lain). Kami sampai ke saklar jaringan yang menjalankan ruang server (ini adalah ruang server dengan semua server internal untuk perusahaan, dengan pelanggan yang menghadapi server di ruang server lain). Saklar itu adalah sakelar kelas perusahaan besar dengan tiga catu daya di dalamnya. Persediaan adalah N +1 sehingga kami hanya perlu dua untuk menjalankan sakelar.

Kami mengambil kabel dan menariknya. Sayangnya bagi kami dua lainnya dicolokkan ke dalam satu colokan listrik, yang segera meledak ketika beban naik pada dua catu daya yang dicolokkan ke dalamnya. Sysadmin kemudian panik dan menancapkan kabel ketiga. Switch mencoba untuk menyala, menempatkan seluruh beban switch ke catu daya tunggal. Alih-alih catu daya dimatikan, itu meledak dalam hujan percikan tidak 12 inci dari wajah saya mengirim saya melompat kembali ke rak server.

Dari naluri saya mencoba untuk melompat ke samping, tetapi sayangnya di sebelah kiri saya ada tembok, dan dua kanan saya adalah orang dengan fasilitas 6'4 "yang sangat besar. Saya beberapa cara berhasil melompati dia, atau mungkin melalui dia memantul dari rak Compaq (yang dengan front mesh tipis) tanpa meletakkan keseluruhan di rak, dan tanpa menyentuh fasilitas pria.

21
mrdenny

Pada titik tertentu dalam karier saya, suatu penyelidikan hukum di perusahaan tempat saya bekerja memberikan persyaratan kepada kami bahwa semua email harus disimpan dari "hari ini" ke depan, sampai diberitahukan sebaliknya. Setelah sekitar satu tahun menyimpan cadangan penuh harian dari lingkungan pertukaran kami (1TB setiap malam) kami mulai kehabisan ruang.

Admin pertukaran menyarankan agar kami hanya menyimpan setiap salinan email ke-8. Untuk melakukan ini, kami meminta mereka mengembalikan basis data pertukaran hari, mengekstrak surel yang mereka perlukan (orang-orang tertentu yang ditandai untuk diselidiki) dan mengarsip ulangnya. Mereka melakukan ini untuk setiap 8 hari email untuk semua cadangan kami. Hari ke 8 dipilih karena pertukaran memiliki set parameter di mana "item yang dihapus" disimpan dalam database selama 8 hari.

Setelah mereka menyelesaikan setiap arsip, saya akan kembali dan menghapus cadangan yang lebih tua dari yang mereka arsipkan.

TSM tidak memiliki cara mudah untuk melakukan ini, jadi Anda harus secara manual menghapus objek dari database cadangan.

Saya menulis sebuah skrip yang akan menghapus semua cadangan yang lebih lama dari tanggal tertentu, dengan cara perhitungan tanggal menggunakan perbedaan antara hari ini, dan tanggal yang dimaksud. Pada suatu hari saya harus menghapus sekitar satu bulan cadangan, kecuali ketika saya membuat perhitungan tanggal saya membuat kesalahan ketik dan memasukkan tanggal sebagai 7/10/2007 bukannya 6/10/2007, dan menjalankan skrip. Saya menghapus seluruh data ekstra sebulan, tanpa sengaja yang merupakan bagian dari gugatan yang sangat penting.

Setelah itu, saya menambahkan beberapa langkah ke skrip untuk mengonfirmasi bahwa Anda ingin menghapus data, dan menunjukkan kepada Anda apa yang akan dihapus ...

Untungnya, mereka bahkan tidak pernah menggunakan data apa pun yang kami susah payah lindungi, dan saya masih memiliki pekerjaan.

20
WerkkreW

Setelah seharian yang panjang atau penelusuran kinerja dan penyetelan mainframe yang besar (Anda tahu binatang buas yang membutuhkan waktu beberapa jam sebelum semua situs cadangan siaga telah sepakat bahwa itu benar-benar di-boot lagi dan sepenuhnya disinkronkan) Saya mengulurkan jari-jari saya, mengetikkan shutdown yang puas -P sekarang di Prompt laptop saya, tutup tutupnya, menarik keluar kabel serial dari mainframe, dengan antisipasi gelas bir dingin yang enak.

Tiba-tiba saya mendengar suara memekakkan dari mainframe saat laptop saya masih menampilkan X.

Sambil menunggu mesin untuk sepenuhnya online lagi, saya memutuskan bahwa saya punya waktu untuk mengaktifkan ACPI di laptop saya sehingga saya tidak pernah tergoda untuk mematikan laptop saya.

20

Saya menghapus akun seseorang secara tidak sengaja, membuat nama-nama itu tercampur dengan nama yang saya anggap dihapus. Opps

Bagian yang keren adalah mereka tidak pernah tahu apa yang terjadi. Mendapat panggilan yang tidak dapat mereka masuk, satu sen jatuh tentang akun yang saya hapus.

Sementara di telepon dengan mereka, saya dengan cepat membuat kembali akun mereka, melampirkan kembali kotak surat lama mereka (untungnya Exchange tidak langsung menghapus kotak surat) dan mengarahkannya kembali ke file pengguna lama mereka.

Lalu saya menyalahkan mereka karena lupa kata sandi yang baru saja saya atur ulang untuk mereka :)

16
SpaceManSpiff

Secara tidak sengaja menginstal file tar.gz di kotak Gentoo Linux saya di tempat yang salah dan meninggalkan file di semua tempat. Ini pasti sekitar tahun 1999, 19 pada saat itu (terima kasih atas komentar di bawah)

Menjadi geek yang saya, saya memutuskan untuk mencoba skrip sendiri dari pekerjaan melalui manual setiap file.

Jadi saya mencoba:

tar --daftar evilevilpackage.tar.gz | xargs rm -rf

Tidak butuh waktu lama bagi saya untuk memperhatikan bahwa tar juga mendaftar semua direktori yang digunakan oleh program, yang termasuk adalah ''/usr,/var,/etc '' dan beberapa lainnya yang saya tidak benar-benar ingin pergi.

CTRL-C! CTRL-C! CTRL-C! Sangat terlambat! Semuanya hilang, instal ulang waktu. Untungnya kotak itu tidak mengandung sesuatu yang penting.

16
Andrioid

Kecelakaan ini tidak terjadi ... tetapi perlu disebutkan:

Saya dikirim ke pusat data yang banyak digunakan untuk melakukan tes bandwidth pada sirkuit baru. Saya sampai di ruang demarc/IDF, menemukan tempat di salah satu rak untuk router tes saya, membuat koneksi saya, dan memulai tes. Sayangnya, saya benar-benar gagal untuk melihat router perbatasan dalam-produksi tidak hanya berada di rak berikutnya (hampir pada tingkat yang sama), tetapi itu juga membuat dan model yang sama dengan router pengujian saya.

Ketika tes selesai, saya mulai menekan sakelar daya ke posisi mati (... bayangkan dalam gerakan lambat ...) dan, saya bersumpah, ketika saya memberikan tekanan, saya sadar bahwa router saya kira-kira sekitar untuk mematikan adalah yang di produksi. Jantungku berdegup kencang dan aku hampir ... yah, gunakan imajinasimu.

Saya meninggalkan pusat data MDF tampak ketakutan dan pucat, tetapi pada saat yang sama senang saya masih memiliki pekerjaan!

16
l0c0b0x

Sebagai bagian kecil dari kehidupan saya sebelumnya, saya mengelola file server perusahaan, sebuah netware 4.11 kotak. Hampir tidak pernah membutuhkan input sama sekali, tetapi jika itu terjadi, Anda membuka jendela konsol jarak jauh.

Digunakan untuk menggunakan DOS setiap saat, ketika saya selesai, saya secara alami akan mengetik "Keluar". Untuk Netware, "keluar" adalah perintah untuk mematikan OS. Untungnya, itu tidak akan membiarkan Anda mematikan kecuali Anda terlebih dahulu "Down" server. (Jadikan itu tidak tersedia untuk jaringan/klien) Jadi ketika Anda mengetik "Keluar" di konsol, itu sangat membantu mengatakan, "Anda harus terlebih dahulu mengetik" Turun "sebelum Anda bisa keluar"

Tanyakan kepada saya berapa kali saya 1: mengetik "keluar" di sesi konsol dan 2: Ketik mengetik "Turun" dan kemudian "Keluar" sehingga saya bisa "menyelesaikan apa yang saya coba lakukan"

Dan kemudian telepon mulai berdering .....

LOL

12
Bob

Tempat terakhir saya bekerja, rekan kerja saya membawa anak-anaknya bersamanya di ruang server (mengapa? Saya TIDAK PUNYA IDEA!).

Dia memastikan bahwa mereka jauh dari server dan menjelaskan kepada anaknya yang berusia 5 tahun bahwa dia tidak boleh menyentuh APAPUN dari server dan TERUTAMA tidak ada saklar daya.

Faktanya, dia menempatkan mereka di dekat pintu ... (dapatkah Anda melihat ke mana arahnya ...?)

Bocah itu tidak menyentuh salah satu tombol daya server ... Tidak, itu akan terlalu mudah dijelaskan. Alih-alih, dia menekan TOMBOL MERAH BESAR yang berada di dekat pintu ... Tombol yang mematikan daya ke SELURUH KAMAR SERVER !!!

Saluran telepon segera mulai menyala bertanya-tanya mengapa Exchange, Server File, dll. Tidak tersedia ... Bayangkan mencoba menjelaskan ITU kepada CEO!

-JFV

11
JFV

Kisah lain yang tidak terjadi (Fiuh):

Kami melakukan backup bertahap setiap hari ke tape drive.

Kami kebetulan menulis rekaman yang berisi data untuk dikirimkan kepada orang lain. Mereka berkata 'kami tidak bisa membaca rekaman Anda'. Bahkan, kita juga tidak bisa. Atau rekaman apa pun sebenarnya.

Kami membeli tape drive lain dan menahan napas sampai kami memasangnya.

Pesan moral dalam cerita. Selalu pastikan Anda menguji cadangan Anda.

11
Matthew Farwell

Saya pernah berkelahi dengan perangkat lunak pemantauan APC UPS. Menjadi perusahaan kecil, kami memiliki beberapa UPS kecil dan berbagai server yang disiapkan untuk memantau mereka. Sebagian besar server adalah Linux, tetapi beberapa menjalankan Windows dan jadi mereka yang digunakan karena perangkat lunak APC adalah Windows saja.

Namun, perangkat lunak APC pada saat itu sulit dikodekan untuk menganggap UPS yang diajak bicara juga memberi daya pada PC yang sedang berjalan! Ini bukan kasus untuk server ini, tetapi saya menemukan bahwa sudah terlambat untuk menghentikannya. Sayangnya, pemrogram utama mendemonstrasikan produk perusahaan kepada mitra - itu adalah aplikasi berbasis web, berjalan di server yang sama. Saya tidak ingin perangkat lunak APC dimatikan ...

10
staticsan

Saya bekerja untuk penyedia nirkabel di Amerika Utara, dan telah melakukan beberapa pelatihan untuk seseorang dalam grup saya untuk menjalankan perintah kerja. Aku begadang selama dua malam pertama (kami melakukan segalanya selama pemeliharaan jendela), tetapi dia baik-baik saja dan mengatakan dia harus mempelajarinya sendiri, jadi aku membiarkannya dan meninggalkan ponselku dan pager. Saya masuk dan memeriksa konfigurasi ketika saya bangun jam 8 pagi keesokan paginya.

Perubahannya adalah bahwa kami menambahkan kumpulan alamat IP baru untuk BlackBerry , kumpulan yang kami tambahkan sekitar 10.000 alamat. Untuk melakukan ini, kami menambahkan rute pada router yang menunjuk ke alamat prosesor pada blade yang melakukan semua pemrosesan panggilan (pada dasarnya ini berfungsi seperti proxy). Selain itu, kami masuk ke prosesor dan mengkonfigurasi kolam IP, dan menautkan kolam IP yang akan digunakan untuk pengguna nirkabel kami. Namun untuk pengujian, kami biasanya mengonfigurasikan ini pada satu prosesor (sebenarnya menyalakan telepon dan menguji semua fitur), dan kemudian hanya memindahkan konfigurasi ke prosesor yang sebenarnya kami inginkan.

Maju cepat dua minggu, dan saya mendapat telepon dari pusat kendali kami bahwa ada banyak panggilan tentang beberapa masalah BlackBerry yang terputus-putus, dan beberapa BlackBerry yang mereka lihat sepertinya bersepeda melalui kolam renang umum, tetapi tidak sangat yakin apa yang terjadi. Hanya butuh sekitar 5 menit bagi saya untuk menyadari bahwa ini adalah kolam baru yang baru saja ditambahkan oleh rekan saya dua minggu sebelumnya. Juga tidak butuh waktu lama untuk melihat bahwa router memiliki dua rute di dalamnya, satu menuju prosesor uji, dan satu pergi ke prosesor panggilan yang tepat. Karena itu, dia lupa untuk menghapus rute ke prosesor tes, dan itu menggantikan rute yang tepat.

Pada dasarnya BlackBerry akan terhubung ke jaringan, terhubung ke proxy untuk mendapatkan alamat IP-nya, proxy akan memberikannya alamat dari kumpulan dengan rute yang salah, dan BlackBerry akan mencoba dan berbicara dengan RIM relai, dan respons akan dialihkan ke proksi uji dan tidak akan pernah kembali ke pengguna, pada dasarnya berarti tidak ada konektivitas.

Kami beruntung karena BlackBerry memiliki perilaku bahwa jika mereka tidak dapat menghubungi relai, mereka akan memutus/menyambung kembali ke jaringan, tetapi meskipun demikian beberapa perangkat RIM tidak memiliki layanan hingga beberapa jam hingga mereka dapat beralih ke perangkat yang berfungsi. kolam. Saya berpikir kembali, dan ketika saya mengecek pekerjaan, saya hanya memeriksa konfigurasi proksi yang baru bagi orang ini, saya tidak pernah memeriksa konfigurasi perutean karena orang ini sebelumnya dengan tim backbone dan perutean adalah miliknya. Ups!

Saya memperbaikinya dan meneleponnya sore itu, harinya berjalan dengan baik, tetapi saya mulai dengan maaf, tetapi saya akan menghancurkan Anda sepanjang minggu. Setahun kemudian cerita masih muncul di sekitar bir.

8
Kevin Nisbet

Tersandung server menara yang terjepit di belakang rak dan memukul kepalaku di belakang router Cisco utama saat aku turun. Jadi mengungkapkan betapa longgarnya kabel listrik yang sebenarnya duduk di catu daya di bagian depan Catalyst 65 .

Ya. Kami punya masalah di kait di ruang server sekarang. Dengan namaku di atasnya.

8
Bill B

Saya memberi sysadmin baru tur aplikasi Manajer Layanan. Saya berkata, "Jika Anda perlu menghentikan layanan ini, Anda akan mengklik tombol ini, tetapi Anda tidak boleh melakukannya di siang hari." Anda tidak akan pernah percaya betapa sensitifnya tombol mouse-nya!

Dua menit kemudian layanan sudah mulai lagi, dan tidak ada yang memperhatikan.

8
Antony

Bibiku meminta saya untuk memperbaiki komputer mereka. Mereka mengatakan itu tidak akan boot dan sudah seperti itu selama 2 minggu. Saya menduga itu adalah BIOS atau OS.

Saya duduk di depan komputer mereka. Aku berjongkok untuk menekan tombol power. Saya melihat ke atas.

BIOS berlalu. Itu bagus.

OS boot. Itu bagus.

Saya menggerakkan mouse sekitar berpikir mungkin ada masalah dengan perangkat input. Tidak ada masalah dengan perangkat input.

Saya membuka pengolah kata-nya. Itu berlari.

Saya mencetak tes printer. Itu dicetak.

Pada titik ini, saya berdiri dan memberi tahu bibi saya (yang memperhatikan saya) bahwa tidak ada yang salah dengan komputer. Dia mengklaim bahwa itu tidak seperti itu sebelum saya duduk.

Sekarang saya dapat mengklaim kepada keluarga saya bahwa saya sangat bagus, bahwa saya dapat memperbaiki komputer apa pun hanya dengan duduk di depannya.

7
MrValdez

Ketika saya pertama kali dipekerjakan sebagai sysadmin oleh admin utama ... dalam minggu pertama kami menerima server Dell baru ... Windows Server 2003 ... itu adalah bayi kecilnya sampai saya diam-diam dipanggil ke ruang server pada tengah malam suatu Sabtu malam untuk membersihkan banyak contoh malware dari itu karena dia MENYELESAIKAN WEB dengan itu sebelum penyebaran TANPA ANTIVIRUS !!!

Pembersihan malware adalah sesuatu yang saya punya banyak pengalaman, tetapi karena ini adalah server saya melakukan format dan menginstal ulang menjadi lebih aman.

Saya tidak pernah mengatakan sepatah kata pun kepadanya tentang hal itu. Dia tahu dia telah mengacaukan secara meriah.

7
cop1152

Lebih dari hal penulisan skrip pribadi daripada hal administrasi sistem, tetapi ...

Saya sedang menulis skrip Perl untuk bertindak seperti makro yang akan mengambil sekarang memainkan informasi dari Banshee dan memasukkannya karakter demi karakter sebagai peristiwa keyboard menggunakan program "xte". Dengan cara ini, saya bisa membuatnya bekerja dalam program tanpa interaksi khusus, itu akan seperti saya mengetiknya.

Yah, saya mengkodekan hal itu hampir dengan sempurna. Saya memutuskan untuk mengujinya dalam beberapa permainan acak. Tekan tombol untuk membuka obrolan itu shift + enter. Sekarang untuk melakukan ini, saya harus menahannya shift, tekan enter, lalu lepaskan shift. Sayangnya di tergesa-gesa saya lupa "lepaskan shift". Saya menjalankan skrip dan ini menyebabkan efek samping yang agak lucu dari tombol shift saya dikunci. Saya pikir "tidak masalah, saya hanya akan pergi ke terminal dan secara manual mengetikkan baris untuk melepaskan shift". Sayangnya, seperti yang diketahui semua orang, Linux peka huruf besar-kecil. Itu tidak akan menerima perintah dalam semua huruf karena saya harus memasukkannya. Saya tidak bisa "melawan shift" atau semacamnya.

Hal ini menyebabkan perburuan lima menit dari saya mengunjungi situs web dan menggunakan mouse untuk menyalin + menyisipkan huruf kecil ke terminal untuk membentuk perintah yang saya butuhkan untuk mematikannya.

7
DWilliams

Bukan masalah besar, tapi tentu saja pagi 'Telur di wajahku' sekitar 10 tahun yang lalu. Saya telah memeriksa inventaris perangkat keras lama dan mencitrakan ulang cakram yang siap untuk dibongkar. Mencoba menemukan cara paling efisien untuk melakukan ini, saya telah membangun CDRom dengan salinan Norton Ghost dan gambar untuk diterapkan. Anda menyalakan mesin, dan saat POSTing, masukkan CD ke drive. Mesin akan mem-boot CD dan gambar ulang itu sendiri secara otomatis. Bekerja dengan baik.

Masalahnya muncul ketika saya membuat salinan CD sehingga saya bisa membuat lebih banyak mesin paralel. Saya selesai membakar CD terakhir, mematikan komputer desktop saya dan pulang untuk hari itu. Anda bisa menebak apa yang terjadi keesokan paginya. Saya masuk, menyalakan PC saya dan pergi dan membuat kopi ...

Ketika saya kembali karena suatu alasan mesin saya tidak aktif dan tidak menerima kata sandi saya ...

Saya baru saja mengetahui apa yang terjadi dan mulai bersumpah ketika orang lain datang untuk hari itu. Ya, mereka tidak membiarkan saya hidup selama beberapa saat.

7
Sam

Kembali pada hari itu, ketika saya masih sangat hijau, saya perlu menginstal perangkat lunak AV pada PC pengguna saya, karena sepertinya tidak ada yang memilikinya. Jadi saya menghabiskan sedikit waktu mencari tahu cara melakukan instalasi jarak jauh, daripada menyodok sekitar 40 atau 50 desktop. Instalasi jarak jauh berjalan dengan sempurna dan semuanya tampak baik-baik saja, sampai berbagai manajer mampir ke kantor saya untuk mengeluh bahwa mereka tidak bisa masuk.

Ternyata beberapa orang memiliki Symantec AV diinstal pada mesin mereka, dan ini tidak hidup berdampingan dengan perangkat lunak McAfee yang saya gunakan dan akan mengunci mesin setelah upaya login.

Untungnya, mungkin untuk menonaktifkan layanan dari jarak jauh jika Anda sampai ke mesin sebelum mereka mencoba masuk, jadi saya berhasil mendapatkan poin untuk memperbaikinya daripada harus membangun kembali semua manajemen senior PC ...

7
user2278
6
Rook

Dilakukan oleh salah satu karyawan saya ... Contoh sempurna mengapa Anda memberi label dengan jelas pada server Anda:

Mengirim karyawan saya ke colo untuk membangun kembali server database MSSQL sekunder (yang tidak memiliki data saat ini). Yang utama aktif digunakan. Anda mungkin dapat memprediksi sisa cerita ini ... Setiba di sana, ia me-reboot server, mulai menginstal dan memformat ulang drive, hanya untuk meminta saya memanggilnya dan bertanya kepadanya mengapa server database primer tidak lagi merespons. (doh)

6
skraggy

Milik saya terjadi hanya 6 bulan yang lalu. Kami baru saja beralih ke server baru untuk aplikasi web PHP/MySQL. Karena saya harus memilih OS, saya memilih yang paling saya kenal/nyaman dengan: Ubuntu.

Kami memiliki sejumlah skrip cadangan yang akan dijalankan oleh cron setiap jam, setiap hari, dll. Transisi berjalan dengan sempurna. Hanya ada sekitar 2 menit down time sementara saya mentransfer DB MySQL dari server lama ke yang baru dan beralih IP.

Namun beberapa minggu kemudian, saya bekerja di MySQL pada baris perintah dan menghapus beberapa catatan pengujian lama yang tidak lagi diperlukan. Karena saya seorang programmer pertama, sysadmin kedua, saya sudah terbiasa mengetik semi-colon (;) saya terlebih dahulu dan kemudian mengetikkan perintah. Yah, ketika saya akan menambahkan klausa WHERE ke permintaan DELETE saya, saya tidak sengaja menekan tombol enter. ... oops.

Query OK, 649 rows affected (0.00 sec)

"Bukan masalah besar," pikirku. "Pencadangan per jam baru saja selesai 4 menit yang lalu. Mungkin ada 3 catatan yang hilang di semua. Saya segera pergi ke direktori cadangan dan dipulihkan. Masalah terpecahkan.

... Lalu saya perhatikan cap waktu di cadangan. Sudah 17 hari. Tidak ada cadangan lain. Saya baru saja memusnahkan semua yang ada di sistem masuk kurang dari 17 hari sebelumnya.

Ternyata ada bug di daemon cron Ubuntu yang menyebabkannya tidak menjalankan file skrip dengan titik (.) Di mana saja dalam namanya. Itu tidak menimbulkan kesalahan, jadi tidak ada bukti masalah. Itu hanya menolak untuk menjalankannya. Semua skrip cadangan kami memiliki titik-titik pada namanya. Mereka bekerja dengan sempurna sebelumnya, tetapi tidak sekarang.

Pelajaran yang saya pelajari:

  1. Jangan meletakkan tanda titik koma di baris perintah MySQL hingga Anda benar-benar ingin menjalankan kueri.
  2. Periksa stempel waktu pada file cadangan Anda sebelum mengembalikannya.
  3. ji skrip cadangan Anda dan pastikan skrip benar-benar berfungsi.
6
Andrew Ensley

Lebih lama dari yang saya kira, saya adalah orang teknis perusahaan dan bekerja dengan beberapa konsultan yang memasang aplikasi mereka. Perangkat kerasnya adalah DEC VAX dan menggunakan server penyimpanan HSC50. Konsultan mengambil sebagian besar hari dengan instalasi mereka, dan setelah mereka pergi, saya memutuskan untuk mencadangkan disk sistem ke disk kosong menggunakan utilitas salin bit-untuk-bit HSC50. Setelah salinan selesai dan saya mencoba untuk me-reboot, saya menemukan bahwa saya telah membalikkan nama-nama sumber dan target disk, dan telah membuat cadangan disk kosong bit-for-bit ke disk sistem.

Saya dapat membangun kembali VMS pada disk sistem, dan menginstal ulang banyak aplikasi, tetapi saya pikir itu tidak pernah berhasil juga. Sejak itu, jika saya melakukan copy/backup/dll, saya akan menulis-proteksi source disk sebelum melanjutkan. (Sekarang switch proteksi tidak ada lagi, saya melihat perintah sebelum Saya tekan Return.)

6
JonP

Saya dipanggil untuk menyelidiki peringatan yang datang dari mesin Windows yang menunjukkan bahwa sistem pemantauan tidak memiliki file lisensi. Saya membuka Prompt perintah dan mulai menyelidiki masalah dan menemukan bahwa perintah windows dasar bahkan tidak ada.

Seorang sysadmin yang telah menjalankan skrip dari jarak jauh telah menulis skrip yang menggunakan perintah del untuk menghapus folder yang ditentukan oleh root dan subfolder dengan folder yang ditentukan dalam Variabel Lingkungan. Jika Variabel Lingkungan tidak disetel, itu diam-diam menghapus seluruh partisi.

Ketika diberi tahu, sysadmin sangat terkejut sehingga mereka mengkonfirmasi aksinya dengan menjalankan skrip tersebut di buku catatan mereka sendiri, sehingga membuangnya juga.

Yang luar biasa adalah Windows berjalan dengan baik, sampai kami me-reboot server. Hanya perangkat lunak pemantauan pelit yang dikeluhkan.

Itu adalah server Active Directory sekunder untuk partai politik. Ups.

5
Stuart Woodward

Menambahkan aturan bypass ke firewall untuk mempercepat beberapa unduhan BitTorrent. Ternyata sistem yang digunakan aturan bypass tidak terlalu stabil, dan itu menghapus firewall. Ini adalah firewall perbatasan untuk koneksi Internet setiap sekolah di kota. Lebih buruk lagi, reboot itu cukup untuk menyebabkan hard drive firewall mati. Lucu? Tidak terlalu banyak. Kegagalan spektakuler? Pastinya.

4
Mark

Milik saya adalah upaya tim tag.

Saya diperintahkan oleh manajemen untuk mencatat salah satu DBA kami ke server sehingga dia bisa melakukan semacam pembersihan. Dia menjalankan pertanyaannya dan segera pager kami pergi, yang memicu kata-kata kasar dari kami berdua.

Ternyata, pembersihan sebenarnya setetes database, dan seharusnya dilakukan pada salah satu server pengembangan. Namun, instruksi yang saya terima membuat saya percaya ini adalah tugas pembersihan kecil yang seharusnya terjadi dalam produksi.

Untungnya, kami dapat memulihkan dari cadangan dengan kehilangan data minimal.

Hal yang dipelajari: Pastikan Anda SELALU tahu persis apa yang seharusnya Anda lakukan saat mengacaukan server produksi. Jika ada ketidakpastian, yang terbaik adalah Anda mendapatkan clairification.

4
Bill B

Baik. Mendapatkan & pada keyboard AS, tekan Shift-7. Untuk mendapatkannya di keyboard Swedia, tekan Shift-6. Jadi, apa yang Anda dapatkan ketika Anda menekan Shift-7 pada keyboard Swedia? Anda mendapatkan /.

Bertahun-tahun yang lalu tata ruang Swedia tidak begitu umum. Preferensi pribadi saya adalah menggunakan tata letak AS. Suatu hari saya ingin menghapus banyak file dan subdirektori dalam direktori.

Aku pukul:

rm -fr *

Tapi itu terlalu lambat, jadi saya dengan cepat menekan:

Ctrl-C rm -fr * &

Atau apakah saya? Ya saya tidak melakukannya. Butuh beberapa detik bagi saya untuk menyadari bahwa saya menggunakan keyboard Swedia. Lihat di atas untuk memecahkan kode apa yang terjadi. Dan bencana itu adalah sebuah fakta.

Itu adalah hari ketika saya mempelajari perintah:

dd

Saya berhasil pada dasarnya akhirnya dari disk ke tape, hanya saja butuh sepanjang malam. Hari berikutnya saya mengetahui bahwa sistem akan diinstal ulang pula.

Saya beruntung, tetapi saya belajar beberapa hal.

4
fredarin

Ketika sebagian besar armada server masih Windows NT, metode remote utama yang digunakan adalah pcAnywhere. Kami memiliki bug "terkenal", yang terkadang server tiba-tiba restart saat menggunakan pcAnywhere, dan pengguna akhir diberi tahu tentang bug terkenal ini.

Bugnya adalah pcAnywhere (setidaknya versi mana pun yang kami gunakan) memiliki tombol "reboot Host" di sebelah tombol "disconnect from Host". Jadi setiap saat ...: D

4
marty

VNC akan menjadi Server Win 2k 200 mil jauhnya, pergi untuk menambahkan alamat IP, jadi ... klik kanan pada ikon jaringan di system tray, klik 'Nonaktifkan' bukan 'Properti' - DOH! .... Solusi .... Masuk mobil. Tidak senang! Kalau saja mereka memiliki 'apakah Anda yakin' pada opsi menu itu!

Mike

4
Mike McClelland

Musim panas 2002.

Saya secara tidak sengaja menggunakan IE 6.0 dengan reboot paksa ke 16.000 pengguna di tengah hari.

Sebenarnya saya menangkap kesalahan saya dan mengetik tercepat shutdown odadmin semua (Perintah Tivoli untuk menghentikan semua server penempatan).

3
Shawn Anderson

Di Linux dan FreeBSD hostname -s akan "Menampilkan nama Host pendek. Ini adalah nama Host yang dipotong di titik pertama".

Pada Solaris 9, hostname -s akan SET nama host menjadi '-s'.

Jadi, rekan admin saya menjalankan skrip untuk mengaudit semua 120 sistem kami, termasuk 10 server Oracle Database Mission Critical yang berjalan di Solaris 9.

for Host in `cat all-hosts`; do
ssh $Host "hostname -s"
done

Semua server Oracle kami gagal secara instan. Kecepatan kegagalan ini benar-benar luar biasa, Butuh sekitar 20 detik bagi kami untuk pulih dari kesalahan ini, tetapi sudah terlambat. Semuanya turun.

Ironisnya, pusat data kami mengalami kegagalan daya besar hanya beberapa hari sebelumnya, dan kami memperbarui spreadsheet "daya turun/daya" untuk memastikan pemulihan yang lebih cepat untuk setiap gangguan daya di masa depan.

3
Stefan Lasiewski

Bukan saya, tapi seseorang yang bekerja dengan saya. Mereka membuat kebijakan di server AV yang berisi * di bidang proses. Dalam istilah awam: jangan izinkan membaca, menulis, mengeksekusi ke proses apa pun yang berisi nama *.

Kebijakan ini kemudian direplikasi ke 1.500 server, yang pada gilirannya mematikan RDP dan proses lainnya. Untuk memperbaikinya berarti me-mount setiap hard drive server satu per satu dan menghapus kebijakan. 48 jam dengan tim 15.

3
stuart Brand

Saya seorang programmer, jadi semua kesalahan saya milik Stack Overflow. Namun, di bawah ini adalah beberapa kesalahan administrator sistem yang saya saksikan.

  1. Cabut izin masuk dari SEMUA pengguna di domain Windows NT. (Selain administrator builtin di PDC, sayangnya hanya kontraktor yang mengatur domain yang tahu kata sandi, dan mereka sudah lama hilang) Saya tidak benar-benar tahu bagaimana ini dicapai. Saya tahu bahwa saya harus duduk dan mengobrol dengan sesama pengembang selama beberapa jam.

  2. Secara tidak sengaja menghapus Server Anggota OU . Itu beberapa jam lagi mengobrol sementara pemulihan dari tape dilakukan.

  3. Admin kami bermaksud memberikan semua admin domain izin untuk menggunakan akses CD & floppy drive. (Kami menggunakan SecureNT untuk mengontrol akses ke media yang dapat dilepas pada saat itu.) Sayangnya ia mendapatkan keanggotaan grup mundur dan sebaliknya memberikan semua pengguna media yang dilepas hak administrator domain penuh juga. Saya menemukan ini karena beberapa tabel muncul dalam database SQL produksi yang telah dibuat oleh pengguna yang seharusnya tidak bisa. Ketika saya mengatakan kepada administrator yang bersangkutan saya menikmati menonton wajahnya berubah dari, tidak, itu benar, sampai, oh ****. Untungnya tidak ada kerusakan serius yang terjadi.

3
pipTheGeek

Ha, kecelakaan besar pertama saya adalah ketika saya sedang menulis panel Admin SVN kecil di server pengembangan kami, perangkat lunak yang sama sekali tidak aman yang hanya digunakan untuk memperbarui situs web "Pengembangan" internal.

Kadang-kadang repo SVN akan rusak sehingga saya telah menulis tombol yang akan memanggil file PHP, yang akan membersihkan seluruh direktori SVN yang diminta, dan terlihat seperti ini ..

<?php
$directory=$_GET['dir'];
$result = Shell_exec("Sudo rm -Rvf /".$direcory);
echo $result;
?>

Bagi mereka yang tidak melihatnya - saya salah mengeja "$ direktori" di Shell_exec, menyebabkan sistem menjalankan "Sudo rm -Rvf /" .... Pada awalnya saya pikir halaman web hanya memakan waktu menghapusnya semua file dalam repo. Setelah sekitar 10-15 menit saya menemukan saya telah menghancurkan lebih dari 1/2 sistem file.

Ups.

2
grufftech

Kisah mantan majikan itu bagus. Beberapa detail diubah untuk melindungi yang tidak bersalah. Saya punya masalah karyawan, panggil dia Fred, yang telah memiliki banyak masalah produktivitas, tetapi tampaknya telah menebus dirinya sendiri dan telah mendapatkan kembali beberapa hak istimewa. Satu-satunya masalah adalah, ketika hak istimewanya dipulihkan, bug dalam skrip yang menyediakan memberinya beberapa hak istimewa tambahan.

Saya berada di tengah-tengah proyek besar, jadi saya meminta Fred untuk mengemas perbaikan terbaru Windows yang diperlukan untuk suatu aplikasi. (Ini adalah pada hari-hari pra-blaster ketika orang tidak menambal seagama yang mereka lakukan hari ini). Jadi Fred menjalankan tes di lab kami dan semuanya bekerja dengan baik.

Fred kemudian mengajukan beberapa pertanyaan:

"Who should I Push it to?" (Mind you, this is a patch for some custom VB app)

"Everyone", I respond

"Ok, what time should it start?"

"How about 2AM?", I answer. (Figuring I'd have time to look over everything before I left for the day!)

Jadi apa yang terjadi selanjutnya? Dia menyiapkan pekerjaan dengan aplikasi distribusi perangkat lunak kami untuk Push ke semua orang, dan bahkan cukup baik untuk memeriksa kotak untuk setiap platform yang didukung produk. Kemudian, tetapkan waktu mulai untuk 2AM, seperti pada 2AM yang berlangsung sekitar 12 jam di masa lalu.

Hasil? Semuanya me-reboot dan mencoba menginstal beberapa patch runtime VB5. Sekitar jam 2:45 PM pada hari Jumat sore. Semuanya.

Segala sesuatu? Suka 40.000 PC? Iya. 3.000 server Windows? Iya. 300 kotak HP, Sun dan IBM Unix? Iya. Cluster AS/400? Iya.

Satu-satunya hal yang tidak me-reboot adalah Windows DC, karena orang-orang AD menonaktifkan aplikasi kami untuk beberapa alasan. Mimpi buruk suci. Setelah seminggu mengepel, saya tidak percaya bahwa saya masih bekerja.

Bagian lucunya? Fred mendapat promosi besar ke pekerjaan di mana ia tidak bisa melukai apa pun lagi.

2
duffbeer703

Mungkin otak malam lebih kentut daripada yang lain.

Salah satu pengembang mengalami masalah dengan menjalankan Java profiler pada kotak Solaris. Profiler mengeluh bahwa ada dua salinan Libc; satu di /lib dan satu di /usr/lib. Jadi setelah beberapa lds kami memindahkan satu dari /lib karena semuanya menunjuk ke /usr/lib, atau begitulah kata mereka.

Tapi tiba-tiba tidak ada yang berhasil. Tidak ls, tidak cd, tidak cp atau mv. Setelah sekitar 20 menit 'oh omong kosong, oh omong kosong' kami menemukan bahwa salah satu pengembang memiliki salinan Emacs yang sedang berjalan di kotak itu dan kami dapat membuka cadangan /lib salinan Libc dan tulis kembali dengan nama aslinya. Dan voila! Semuanya berhasil. Pelajaran yang dipetik; tinggalkan Libc di tempat yang diinginkan dan jangan lakukan perubahan pada permintaan pengembang di 2 A.M.!

2
beggs

Saya punya satu belum lama ini. Selama beberapa Oracle ODBC penyebaran jembatan, saya harus memodifikasi jalur pada sekitar 500 posting pengguna.

Ini operasi yang cukup sederhana, sungguh. Sayang sekali saya lupa tentang kutipan itu. Orang-orang mulai berdering setelah mereka memiliki beberapa pesan kacau yang aneh (instalasi ODBC gagal), dan sepertinya berpikir me-reboot mesin hanya akan diperlukan jika diperlukan.

Tentu saja, beberapa instalasi lain sebelumnya DILARANG (!!!) beberapa file program path dalam variabel sistem (dengan spasi dan semua, tanpa tanda kutip), sehingga path baru berhenti hanya di sana, di c:\Program (tentu saja, keberadaan dari% ProgramFiles% tetap diabaikan sepenuhnya). Tidak ada sistem, tidak ada system32, tidak ada Shell. Jadi tidak ada skrip masuk juga.

Orang-orang yang memulai ulang tidak memiliki akses jaringan lagi, dan tidak ada skrip otomatis yang dapat memperbaiki kerusakan. Tentu saja, segera setelah saya pergi ke pengguna yang mengeluh, melihat sekeliling dan memeriksa jalan setapak, saya merasakannya .. tenggelam dalam perasaan.

Dalam sekitar 30 menit, saya memiliki skrip lain, dengan nilai jalur paling standar, siap dikirim ke semua orang (email masih berfungsi). Pengguna bahkan menelepon kembali untuk memastikan tambalan itu nyata, karena mereka tidak terbiasa mengirim exe samar dengan alasan aneh untuk menerapkannya, dan kebanyakan dari mereka bahkan tidak menyadari apa yang terjadi.

Versi pertama berantakan (titik koma baru di setiap eksekusi), tetapi itu mencatat setiap nilai jalur yang mungkin tersedia, jadi saya dengan cepat memiliki data dengan jalur yang mungkin, jadi saya hanya harus membuat sesuatu yang cerdas untuk memeriksa semuanya, akhirnya dapatkan jalur dengan baik di tempat.

Semua dalam semua, itu berlangsung hanya sekitar 45 menit, dan saya beruntung orang yang mengembalikan semuanya baik-baik saja. Tapi tetap saja, ketika jalan rusak muncul sekarang, saya masih siap untuk mengambil kesalahan;)

2
Berzemus

Yang terbaik saya datang pada saat server cadangan kami berada dalam limbo administratif - bos saya "berdebat" apakah harus tetap di kantor, di luar situs dari ruang server kami (dan tidak melakukan backup untuk beberapa alasan) atau apakah itu harus dipasang di ruang server untuk menghemat bandwidth dalam jumlah besar. Saya ingat bahwa keadaan limbo ini ada selama beberapa bulan.

Server web kami memiliki larik RAID 5 untuk penyimpanan situs web. Tampaknya sudah berjalan dalam mode terdegradasi (tanpa memberi tahu saya karena alasan yang tidak diketahui atau yang tidak dapat saya ingat) untuk beberapa waktu sebelum yang kedua dari tiga drive gagal. Saya harus menarik all-nighter menempatkan server kembali. Pelanggan kami tidak Senang bahwa situs web mereka telah menghilang dan mereka perlu memulihkan dari cadangan mereka sendiri. Terutama mereka yang tidak memiliki cadangan sendiri.

Pertanyaan yang diajukan bos saya adalah, "Bagaimana array RAID bisa gagal seperti itu? Saya pikir mereka tidak seharusnya!" dan "Mengapa kita tidak memiliki cadangan server web kita?"

Namun, pelajaran itu tidak diabaikan. Bos saya bersikap kooperatif ketika saya menyarankan agar upgrade ke server mail kami harus menyertakan array RAID 1 dengan cadangan panas (alih-alih berdebat dengan saya mengenai biaya tambahan, yang biasanya dia lakukan). Dan tentu saja, server cadangan melakukan tugasnya dengan benar dalam waktu singkat.

2
Ernie

Bagaimana dengan mempelajari perbedaan antara fitur "Hapus Kotak Pesan" Exchange Server 2007 dan "Nonaktifkan Kotak Pesan"? Terutama ketika saya menghapus kotak surat lama semua orang untuk berurusan dengan database yang rusak?

...

Kembalikan pada server pertukaran ... tidak menyenangkan ... Harus mengembalikan server pertukaran DAN Direktori Aktif ... ganda tidak menyenangkan.

Melakukannya pada jam 11:00 Jumat pagi ... Tak ternilai.

2
IceMage

Saya mencoba untuk membebaskan beberapa ruang di partisi utama situs web server RedHat 5. Saya relatif baru di Linux tetapi telah menggunakan DOS sejak lama.

Saya berhasil memindahkan seluruh folder/bin ke partisi lain, mengeluarkan situs web produksi, dan membiarkan diri sendiri tanpa perintah sistem yang dapat diakses. Saya panik, saya tidak bisa mengganti nama, menyalin, memindahkan, apa pun karena saya telah memindahkan semua executable yang bermanfaat itu.

Untungnya saya bisa menggunakan boot disk dan membatalkan hasil karya saya.

2
Darth Continent

Saya baru mengenal RAID 5 dan masih belajar tentang cara kerjanya. Pada saat itu saya adalah satu-satunya orang IT di perusahaan yang sangat kecil. Semua file yang diakses semua orang disimpan hanya pada satu server. Server semakin rendah ruang dan hanya memiliki 3 drive dalam array RAID, jadi saya pikir menambahkan 4 akan meningkatkan ruang dan responsif. Saya melakukan ini selama jam kerja. Saya belum belajar konsep pemeliharaan setelah jam kerja.

Array mulai dibangun kembali, dan dikatakan akan selesai dalam 36 jam. Saya pikir itu terlalu lama. Saya menemukan slider yang mengontrol prioritas pembangunan kembali, dan itu diatur ke pengaturan terendah. Saya mengaturnya ke media. Waktu turun menjadi 8 jam. Lampu hard drive berkedip sedikit lebih cepat, tapi saya masih berpikir itu masih terlalu lama untuk data hanya 80GB. Jadi saya mengatur prioritas ke tinggi. Lampu hard drive padam, dan saya pikir "itu lebih seperti itu!" Kemudian GUI yang saya gunakan berhenti merespons. Terhubung ke kotak dari jarak jauh. Saya mencoba untuk membawanya kembali, tetapi tidak dapat menemukan server.

Saya mulai mendengar orang-orang di aula mengeluh bahwa mereka tidak bisa masuk ke server. Saya pergi ke server untuk login untuk melihat apa yang sedang terjadi. Butuh 5 menit untuk layar kosong berubah ke latar belakang. Itu 5 menit lagi sebelum Prompt login muncul. Setiap penekanan tombol memerlukan waktu 5 menit untuk mendaftar. Saya telah menetapkan prioritas sangat tinggi sehingga server tidak akan menanggapi apa pun. Butuh waktu 2 jam untuk membangun kembali array. Untungnya itu satu jam sebelum makan siang, jadi tidak ada yang benar-benar peduli. Manajer saya pada saat itu adalah wanita yang sangat keren dan mengatakan itu bukan masalah besar. Insinyur desain kepala memang memberi saya tampilan yang kejam. Saya berkeringat selama 2 jam. Pelajaran yang dipetik.

2
Joseph

Saya memiliki karyawan yang mengeluh laptopnya lambat, jadi saya memeriksa fragmentasi hard drive dan itu (dan sampai hari ini) adalah yang terburuk yang pernah saya lihat. Upaya untuk mendefrag drive tidak membuahkan hasil karena tidak ada ruang kosong yang cukup. Saya mencoba membersihkan file-file sementara (tidak yakin mengapa saya tidak hanya memindahkan barang-barang ke server sementara) dan dengan bodohnya menghapus seluruh Outlook.pst berpikir bahwa itu adalah cadangan emailnya dan bukan emailnya yang sebenarnya. Dia memaafkan saya, tetapi tidak pernah membiarkan saya melupakannya.

(Ini terjadi bertahun-tahun yang lalu tak lama setelah saya lulus universitas. Saya jauh lebih kompeten sekarang.)

2
Scott

Kesalahan yang sangat bodoh. Saya sedang menulis skrip di workstation Linux saya yang memproses sejumlah file, tetapi tidak masalah jenis file itu, asalkan banyak file. Jadi saya memutuskan itu ide yang bagus untuk menyalin /etc ke direktori tempat saya melakukan pengujian. Ketika ada masalah, saya menghapus salinan dan menyalin /etc ke direktori pengujian saya lagi. Itu berjalan dengan baik, untuk beberapa waktu, dan kemudian saya mengetik

rm -rf /etc 

dari pada

rm -rf etc/  

OK, tidak ada yang perlu dikhawatirkan, saya masih bisa melakukan hal-hal di workstation saya dan berpikir saya bisa menghidupkannya kembali dengan menyalinnya dari workstation lain, atau sesuatu. Atau, instal ulang pada akhir hari. Pertama, dapatkan sesuatu untuk diminum, dan karena kebijakan perusahaan, saya mengunci layar saya. Sial, saya perlu kata sandi saya untuk membuka kunci dan itu ada di/etc/.....

Kesalahan bodoh:

  • melakukan terlalu banyak root (saya punya alasan bagus untuk itu O :)).
  • mengetik /etc dari pada etc/
  • menggunakan /etc untuk tujuan pengujian
2
blauwblaatje

Ada saatnya saya tidak sengaja menghapus "bin" pengguna di kotak Unix. Tentu saja, menghapus pengguna menyebabkan direktori home-nya juga dihapus.

Bisakah Anda menebak direktori home bin itu?

/tempat sampah

1
Barry Brown

Beberapa perusahaan yang lalu kami memiliki kotak Windows NT 4 sebagai server utama yang menjalankan semuanya, sebagai cadangan itu memiliki hard drive cermin.

Saya tidak sengaja menghapus beberapa file penting, tidak ada masalah hanya me-restart kotak, pilih disk 2 dari menu SCSI dan kami membuat cadangan dan berjalan pada salinan dalam waktu kurang dari satu menit.

Kemudian saya memulai perintah untuk membangun kembali drive mirror. Ternyata meskipun Windows sekarang memiliki C: dan D: drive yang baru, perangkat lunak mirroring yang pintar tidak akan tertipu oleh itu. Ini menggunakan nomor ID SCSI untuk sumber dan target, dan dengan senang hati menyalin 1-> 2.

Adaptec terima kasih!

1
Martin Beckett

Akhir minggu, semua orang hampir keluar dari gedung, saya pergi ke ruang server untuk memuat kaset baru ke autochanger, untuk cadangan penuh selama akhir pekan. AC terlalu dingin, saya pikir, dan mematikannya (ruang server hanya sebuah ruangan dengan AC yang terpasang di dinding - tidak ada dana untuk sesuatu yang serius). Jadi saya memuat kaset, pastikan TBU membaca barcode, OK, dan keluar.

Hari berikutnya, saya bangun di pagi hari, dengan mabuk (hei, ini akhir pekan!), Lihat telepon saya dan lihat banyak pesan SMS "$ server turun". Lalu satu lagi "UPS utama turun".

Saya ambil kunci, pergi ke kantor, dan membuka ruang server, untuk menemukan sekitar 60c di sana, dan semua peralatan mati.

Akhirnya menyeret beberapa penggemar untuk mengusir udara panas, bahkan sebelum saya dapat memulai kerja AC, belum lagi UPS dan 40+ server dan peralatan komunikasi. Dan menghabiskan akhir pekan di kantor tentunya. Dan berterima kasih kepada semua dewa untuk unit UPS pintar yang dapat menarik semuanya dengan baik jika suhu sekitar terlalu tinggi. Saya selalu menyimpan hoodie sejak itu, dan tidak pernah mematikan AC

1
dyasny

Sepuluh, ditambah tahun yang lalu saya mengerjakan proyek yang membutuhkan proxy SOCKS. Saya telah menggunakan sebuah program yang disebut WinGate yang di samping proksi SOCKS, menyediakan fungsionalitas gateway Internet kecil yang bagus dengan NAT, DHCP dan beberapa keramahan lainnya. Ini terjadi sebelum Windows berbagi Internet Connection, jadi WinGate memungkinkan Anda berbagi modem dial-up Anda dengan jaringan Ethernet Anda.

Saya menginstal perangkat lunak dan mulai bekerja pada fungsionalitas klien SOCKS. Kemudian pada hari itu, kami kehilangan konektivitas internet. Tiba-tiba, itu hanya berhenti dan tidak ada yang bisa mengakses di luar perusahaan. Kami memanggil ISP kami dan semuanya tampak baik-baik saja pada koneksi. Router bekerja dengan baik. Kami tidak tahu apa yang salah. Saya mencoba pada satu titik karena saya memiliki pengetahuan tentang TCP/IP, tapi saya tidak membuat kemajuan.

Hari berikutnya, orang IT kami mengetahui bahwa server DHCP telah memberikan alamat router ke mesin seseorang, dan semua orang menggunakannya untuk gateway default yang tidak pergi ke mana pun. Kemudian pada hari itu orang ITU kami datang ke kantor saya dan saya bertanya, "Jadi, apakah Anda tahu siapa yang memberikan alamat IP yang salah?" Dia berkata, "Ya, itu kamu!"

WinGate secara default menjalankan server DHCP dan telah memberikan alamat router ke klien pertama yang alamat sebelumnya telah kedaluwarsa. Saya berwajah merah untuk sementara waktu.

1
David Smith

Awalnya ketika saya masih muda, saya mencoba untuk menjadi 'membantu' dan mencoba untuk menyalin 250 MB data melalui garis 128 kbit/s ke 86 situs yang berbeda pada saat yang sama ... selama jam kerja. Sementara saya melakukan ini, saya mendengar orang bertanya mengapa semuanya begitu lama.

Tak perlu dikatakan, saya membunuh transfer, dan (untungnya) tidak ada yang tahu itu saya!

1
JFV

Kami membangun sistem turnkey IVR untuk klien di kotak Unix. Suatu kali para pengembang memiliki semua kode mereka di/devel. Mereka meminta saya untuk menghapus direktori pengembangan dan kotak dan mengambil server ke bandara pada hari Minggu sore (hari libur saya!). Terburu-buru, saya menghapus/dev/*. Seketika melihat kesalahan saya, duduk dan merenung sejenak. Tidak yakin apakah sistem akan mati jika kernel tidak memiliki kait ke perangkat sistem, jadi saya melihat direktori/dev pada mesin yang sama dan untuk melakukan mknod [c | b] minor utama untuk mengembalikan keyboard, tty, drive scsi, fd0 dan null kemudian membuat disket di mesin lain/dev dan dipasang dan disalin secara lokal untuk mendapatkan sisanya.

Masih tidak tahu apa yang akan terjadi jika saya meninggalkan semuanya sendirian, tapi saya cukup yakin itu akan tidak bahagia saat reboot :)

Hal yang dipelajari - direktori pengembangan tidak bisa dipanggil/devel.

1
schemathings

Ini terjadi ketika saya baru saja memulai pekerjaan dukungan pertama saya di luar uni, saya terhubung ke server 2003 pelanggan mencoba untuk naik ke salah satu mesin pengguna setelah mereka mengeluh tentang masalah konektivitas.

Membicarakannya melalui beberapa pemecahan masalah dasar dan menyadari bahwa ia memiliki IP statis sehingga mulai membicarakannya melalui pengaturan ini ke DHCP. Saya membuka properti pada koneksi LAN di server untuk digunakan sementara saya berbicara kepadanya melalui apa yang harus dilakukan. Setelah membuatnya mencoba dan mengaturnya kembali ke DHCP itu masih memiliki IP statis sehingga memintanya untuk menonaktifkan koneksi dan mengaktifkannya kembali.

Sekarang pada titik ini saya melakukan semua yang saya katakan padanya di server tanpa benar-benar mengubah pengaturan, sampai pada titik saya memintanya untuk mengklik kanan pada koneksi LAN dan tekan menonaktifkan yang kemudian saya lanjutkan juga.

Butuh waktu setengah detik untuk menyadari apa yang baru saja saya lakukan.

Butuh waktu 10 menit bagi teknisi lain untuk berhenti menertawakan saya sebelum salah satu dari mereka harus berkendara selama satu jam untuk mengaktifkan kembali NIC di situs pelanggan.

1
Darren Mac

Saya biasa menjaga banyak server database, masing-masing dengan siklus pengembangan dan pengujian yang terdefinisi dengan baik. Peran kami adalah untuk menggulung perubahan yang disediakan pengembang, menggunakan dokumentasi mereka dari lingkungan pengujian mereka ke lingkungan pengujian pelanggan untuk pengujian pelanggan sebelum ditayangkan. Sebagai bagian dari itu lingkungan pengujian pelanggan dibangun dari cadangan terbaru dari lingkungan langsung.

Ini semua didokumentasikan dengan rapi, bersama dengan proses untuk menggulirkan perubahan ke lingkungan langsung setelah pelanggan menandatangani perubahan tersebut.

Kami memiliki awal yang baru di tim kami dan setelah dia bersama kami selama beberapa bulan, kami membiarkan dia duduk di sejumlah siklus perubahan sampai suatu malam yang menentukan kami membiarkannya melakukannya sendiri. Pengujian pelanggan berjalan dengan lancar dan pelanggan dengan senang hati menandatangani perubahan.

Awal yang baru kemudian melakukan apa yang dia lakukan setiap kali dia memasukkan perubahan ke lingkungan pengujian, yakin dia tidak perlu mengikuti dokumentasi yang dilakukan oleh kami semua. Langkah (1), membangun kembali dari cadangan sebelumnya ...

Pagi berikutnya pelanggan memperhatikan bahwa pekerjaan hari sebelumnya hilang dan kami tidak butuh waktu lama untuk mengetahui apa yang terjadi. Untungnya database telah mengaktifkan log logging sehingga kami dapat memulihkan semua aktivitas. Awal yang baru setidaknya belajar menghargai dokumentasi dan mengikutinya di masa depan.

1
Cry Havok

Saya memiliki yang baru terjadi pada saya minggu lalu.

Saya memiliki salah satu dari orang-orang saya membangun server DNS sementara untuk platform uji yang kami bangun, saya meminta orang-orang DNS kami untuk memperbarui domain uji tertentu untuk menunjuk pada server DNS temp baru ini, tetapi orang itu memperbarui catatan langsung bukan yang uji .

Tiba-tiba server yang satu ini (untungnya kotak baru jadi spek yang masuk akal) melayani hampir setiap permintaan DNS untuk hampir 5 juta pengguna - 400 juta permintaan pada hari pertama! - untungnya TTL hanya 24 jam sehingga sebagian besar terkuras sekarang.

1
Chopper3

Dimensi yang sama sekali berbeda, tetapi ini masih merupakan kecelakaan administrator sistem.

Maaf: Anda perlu memahami beberapa bahasa gaul Italia untuk mendapatkan ini. Itu tidak dapat diterjemahkan. Anda harus mengetahuinya dengan hati

Saya diminta untuk memperbaiki sesuatu di server Solaris di Napoli, Italia. Saya membutuhkan kata sandi root, dan saya tidak banyak berbicara bahasa Italia pada saat itu. Orang-orang itu tampaknya enggan memberi tahu saya apa itu. Akhirnya salah satu dari mereka setengah berbisik:

sticazzi

Saya berkata: Aha, 'sticazzi'. Bagaimana Anda mengejanya?, dan memberinya selembar kertas + pena.

Setahun kemudian saya bertemu M.*o B.* lagi (Hai! - jika Anda membaca ini). Saat itu bahasa Italia saya jauh lebih baik. Saya mengatakan kepadanya bahwa saya sekarang tahu lebih banyak bahasa Italia.

Itu adalah tawa yang sulit.

Moral dari cerita ini: Jika perlu meminta kata sandi root dalam bahasa yang Anda tidak tahu, setelah itu diberikan kepada Anda lebih baik tertawa, memerah dan terlihat terhina pada saat yang sama.

1
fredarin

Semua orang di suatu saat secara tidak sengaja. Milik saya mencoba untuk menghapus beberapa file tambahan di direktori rumah saya 2 hari sebelum tugas struktur data terakhir saya jatuh tempo.

Secara profesional saya sudah cukup mampu untuk tidak memiliki screw up katastropik sejauh ini.

1
sclarson

Ini tidak terjadi pada saya, tapi saya kira itu adalah kisah yang sangat bagus.

Orang-orang ini bekerja dengan salah satu server menara penuh Solaris lama yang, seperti yang saya ketahui, memegang basis data untuk beberapa basis data Informix yang dimiliki perusahaan ini. Ini adalah perusahaan utilitas dasar sehingga Anda dapat membayangkan berapa banyak data yang berarti.

Ada titik di mana beberapa konfigurasi melalui server disalin pada floppy disk dan kemudian diteruskan dari server ke server. Setelah bekerja dengan server, mereka hanya akan mengeluarkan floppy disk dan beralih ke yang berikutnya.

Didampingi oleh orang lain dalam kelompok sysadmin, orang ini sedang mengerjakan konfigurasi ini ketika mereka berbicara tentang hal-hal acak. Dia menyelesaikan langkahnya sehingga dia menekan tombol untuk mengeluarkan floppy.

- "TUNGGU! Jangan lepaskan tombolnya!"

Ketika dia melihat lagi, dia telah menekan tombol reset pada kesalahan dan bukan tombol eject. Pada saat dia merilis tombol itu, seluruh sistem basis data untuk perusahaan akan segera mati. (Saya pikir tombol-tombol ini seketika ... tetapi beginilah ceritanya.)

Jadi, setiap sysadmin menghentikan apa yang dia lakukan untuk memanggil manajer departemen dan "menyuruh semua orang untuk keluar dari sistem. Sekarang." sementara orang ini terlihat semua yang terjadi terpasang ke server dengan jarinya.

1
Alpha

Saat mengatur alamat IP statis di /etc/network/interfaces pada kotak Debian, seseorang tanpa sengaja mengganti alamat IP pada baris alamat IP dan garis gateway.

Coba tebak apa yang terjadi ketika Anda "mencuri" IP switch inti?

1
prestomation

Oh, suatu hari saya menghapus database PostgreSQL secara tidak sengaja dan memulihkannya dari file log;)

0
maciek

Untungnya saya dapat dengan mudah pulih dari apa yang saya akan bagikan dengan Anda. Jadi, Anda telah mendengar tentang yang terkenal

rm -rf /
deltree/y/s/b \

Masalah saya adalah bahwa saya mengetik ini dan tahu itu salah, jadi saya pergi untuk menekan tombol backspace, tetapi lemak meraba itu dan menekan tombol enter saja! Saya hanya perlu 2 detik untuk menyadari apa yang telah saya lakukan sehingga saya mulai menekan ctrl-c berulang kali untuk membatalkan operasi. Pada saat saya menghentikannya, setengah dari sistem file hilang.

Cadangkan ke penyelamatan, teman-teman saya! Selain reboot, tidak ada down time lain. Dalam satu hal, saya benar-benar beruntung hari itu karena saya memiliki cadangan yang bagus.

0
jftuga

Pada awal saya sistem administrasi saya menemukan beberapa metode baru dalam melakukan proses inventaris (stock taking) untuk toko ritel kami. Saya membawa banyak laptop dan menghubungkan pemindai barcode ke mereka dan membuat proses sepuluh kali lebih cepat dari biasanya seperti ketika kami melakukannya dengan menulis semua artikel dengan pena pada kertas. Saya juga membeli beberapa terminal genggam Symbol PDT DOS. Untuk memperpanjang masa pakai baterai untuk terminal Symbol, saya membuat paket baterai saya sendiri dan kabel yang terhubung secara manual. Malam itu dan keesokan paginya aku sangat bangga pada diriku sendiri dan aku bangga sebagai seekor merak yang berjalan di sekitar kantor mengatakan betapa pandainya aku.

Mimpi buruk dimulai ketika saya mengirim data ke server untuk membuat perhitungan dan perbandingan stok dan daftar. Salah satu perangkat Symbol dengan paket baterai tambahan telah dipasang karena salah satu kabel telah mati dan perangkat tersebut tidak memiliki energi untuk waktu yang lama.

Sekarang semua pekerjaan dari sekitar 100 pengusaha jatuh ke air. Apa tujuan dari 13 atau 15 perangkat dan daftar mereka jika saya tidak memiliki semuanya? Bagaimana saya bisa tahu persediaan apa yang hilang.

Untuk lebih menggambarkan bencana saya, kami hanya memiliki beberapa hari libur dalam setahun. Itu adalah ketika kita menutup toko-toko kita dan mengambil stok, dan acara itu menghabiskan banyak uang dan usaha dari perusahaan kita.

Beruntung bagi saya direktur dan koki kami di persidangan ulang itu masuk akal dan menerima daftar inventaris karena mereka ada di komputer untuk tahun itu.

Setelah itu saya selalu membuat dua salinan data saat pekerjaan masih berlangsung dan hanya setelah kami menyelesaikan proses inventaris dan tentu saja saya tidak sesumbar lagi.

0
adopilot

Saya sedikit sysadmin pemula/hobbiest dengan hanya 30-40 situs host di server saya jadi ini tidak terlalu buruk. Saya menghapus izin eksekusi pada semua file di direktori/bin/xxx dan semuanya dimulai dengan.

Jadi mengambil tindakan nyata, saya berlari

chmod -R a-x .*

Wow. Saat Anda menghapus izin eksekusi pada direktori bin Anda, cukup sulit untuk dibersihkan. Teknisi pusat data harus mem-boot ke CD langsung untuk memperbaikinya. Bagian terbaiknya adalah saya harus memandu mereka melalui cara memperbaikinya. Bagian terburuknya adalah mereka masih cukup tahu untuk menertawakan saya: P

0
Brandon Wamboldt

Pada hari-hari awal Internet saya menjalankan semuanya pada server SGI Challenge S. Pada satu titik, tanpa sepengetahuan saya, "departemen seni" memesan server cetak rendering demo dari IKON. Berjalan di suatu pagi, Tantangan bertindak lucu, admin panggilan ke ruang server, kami pergi melalui diagnostik rutin, dll akhirnya saya mengatakan itu HARUS MENJADI catu daya. Tentu saja kami tidak punya cadangan. Saya berjalan kembali ke kantor utama - lihat mesin peminjam dan sadari - ini juga SGI - buka, buka power supply, reboot server - bingo! Kami memesan cadangan semalam, rep muncul di pagi hari untuk bertanya bagaimana kami menyukai demo, kami harus hummada hummada selama 30 menit sampai FedEx muncul dan kami menukar kembali pasokan listrik dan menggulung kotak demo keluar. Semua dalam satu hari kerja.

0
schemathings

Beberapa waktu yang lalu, saya memutuskan untuk mengubah titik mount partisi data saya. Jadi saya membuat direktori baru, mengubah titik mount di/etc/fstab, dan menghapus direktori yang sebelumnya di-mount.

Masalahnya adalah saya baru menyadari bahwa partisi masih terpasang pada direktori lama ketika nautilus menunjukkan kepada saya progress bar (untuk apa yang seharusnya menjadi penghapusan 4Kb). Untungnya saya dapat membatalkannya sebelum kerusakan besar terjadi, tetapi saya kehilangan beberapa file.

0
Flávio Amieiro

Selama pemeliharaan di satu lokasi, saya menarik kabel daya DNS utama kami. Saya mengganti yang kedua pada saat itu dan pasti menarik kabelnya sebelum saya menutup rak. Semua situs kami mulai turun dengan cepat dan saya harus kembali ke lokasi bersama untuk memasangnya kembali.

0
Snipper

Pada tugas instalasi pertama saya (bertahun-tahun yang lalu, di usia DOS) saya tidak sengaja menghapus hampir semua file sistem dan setengah file aplikasi di komputer milik direktur lembaga publik. Tapi itu bukan salahku. Saya mencoba untuk menghapus file yang tidak penting di folder C:/TEMP untuk mengosongkan sebagian ruang. Hapus dimulai ... setelah beberapa saat saya melihat beberapa nama yang sudah dikenal dari root dan folder DOS yang bergulir di layar ... Memukul Ctrl + Break ... tapi terlambat ...

Itu adalah cara yang lebih sulit untuk mempelajari apa masalah lintas file pada sistem file FAT.

0
miHost

Kami memiliki fasilitas pengujian dingin untuk teknisi kami di Minnesota utara. Sekitar 10 tahun yang lalu T1 yang kami miliki di sana mati. Kami telah memindahkan server dari fasilitas itu ke pusat data utama kami karena kami telah menginstal jalur yang lebih cepat sehingga hampir semuanya tidak berguna di sana. Datang untuk mengetahui bahwa beberapa petani di Minnesota tengah telah menjalankan serat dengan beberapa peralatan pertanian. Kami tidak terlalu senang bahwa serat itu bahkan dapat diakses oleh peralatan itu dan tidak terkubur lebih dalam ...

0
squillman

Bayangkan secangkir kopi. Ini secangkir penuh, dengan gula. Bayangkan itu salah tempat pada baki keyboard yang dapat ditarik. Rak penuh server. Baki entah bagaimana didorong ke rak. Cangkir memasuki rak dan kemudian jatuh.

Itu salah saya, dan saya adalah admin berpengalaman saat itu, jadi saya tidak punya alasan. Ada kamar mandi di dekatnya dan saya bisa membersihkan sebagian besar kekacauan dengan handuk kertas. Untungnya tidak cukup kopi masuk ke dalam server, jadi saya mematikannya dan membersihkannya dengan baik. Hanya 400 pengguna yang terpengaruh. Fiuh!

Lalu ada kecelakaan lain, sebut saja begitu, itu terjadi pada teman saya. Dia telah mendedikasikan 10 tahun terakhir membangun perusahaannya sendiri. Dia memiliki ~ 15 karyawan, dan semua data perusahaan ada di server yang satu ini. Ini termasuk semua proyek dulu dan sekarang, banyak data pelanggan, informasi yang dikontraknya untuk menjaga keamanan, semua informasi kontak, dll. Semua dienkripsi dengan baik dengan LUKS. Saya sudah lama mengganggunya untuk membuatnya mulai melakukan backup, tetapi dia tidak pernah melakukannya. Terlalu sibuk, kekurangan dana, Anda mendapatkan ide. Dia yakin RAID1-nya akan menyelamatkannya. Cadangan terakhirnya berusia 8 bulan. Itu uptime servernya juga. Dia telah mengubah kata sandi LUKS-nya tepat sebelum reboot terakhir, 8 bulan sebelum ini. Sekarang dia me-reboot servernya dan kemudian menyadari bahwa dia tidak menuliskan kata sandi baru, dan dia tidak mengingatnya. Yang bisa diingatnya adalah bahwa itu sangat panjang, dan ada beberapa kata yang kira-kira tersusun dalam beberapa cara dengan semacam huruf kapital dan mungkin simbol-simbol dilemparkan ke dalamnya.

Anda dapat membayangkan tingkat demoralisasi di antara karyawannya dan kemarahan pelanggan yang harus mengirim ulang informasi mereka untuk diproses, sehingga mengetahui bahwa data mereka "sementara" tidak tersedia. Untuk membuat cerita panjang pendek, saya butuh sekitar 40 jam kerja, 14 hari runtime dan program khusus untuk menghasilkan dan menguji lebih dari satu juta kata sandi untuk akhirnya menemukan kata sandi LUKS-nya.

0
joechip

Beberapa tahun yang lalu, administrator iSeries kami saat itu sedang melakukan pembersihan di area di mana server IBM iSeries kami berada di ruang komputer. Ini sekitar jam 8:30 pagi. Ketika saya mulai mengerjakan apa pun yang sedang saya kerjakan saat itu. Layar menjadi kosong beberapa detik kemudian panggilan telepon mulai masuk.

Datang untuk mencari tahu, ketika dia memindahkan meja, kabel listriknya cukup melilit kakinya sampai keluar ketika dia memindahkan meja.

Sekitar dua jam kemudian setelah sistem pulih sendiri dari power down, orang-orang dapat bekerja lagi.

0
Mike Wills

Kami memiliki sedikit kekacauan beberapa tahun yang lalu. Pertengahan pagi, para pengguna mulai melaporkan banyak kesalahan tentang penguncian ketika mengakses aplikasi kami yang di-hosting dengan SQL Server. Aplikasi terhenti sepenuhnya - tidak ada yang bisa melakukan apa pun. Daripada meluangkan waktu untuk mencari tahu apa penyebabnya, kami melakukan reboot darurat dan semuanya mulai berfungsi lagi. Kemudian saya mulai mencari-cari di berbagai log untuk melihat apa yang mungkin memicu itu, dan sesaat sebelum semuanya bungkam, saya menemukan transaksi bernama terbuka terhadap tabel utama tanpa KOMIT yang sesuai.

Ternyata kolega saya telah menulis beberapa SQL di Query Analyzer untuk memperbaiki beberapa data yang salah di tabel utama, dan dia meletakkannya di dalam suatu transaksi. Tapi, alih-alih hanya menekan F5 untuk menjalankannya, dia menyoroti semuanya dan kemudian menekan F5. Kecuali dia tidak cukup menyoroti semuanya ... dia telah melewatkan akhir di mana sebenarnya melakukan transaksi ... meninggalkan meja terkunci.

0
MartW