10 sai lầm cần tránh để khắc phục sự cố IT

Những sự cố lỗi và đưa ra những hướng giải quyết khắc phục sự cố IT sẽ giúp cho chúng ta có nhiều kinh nghiệm hơn, đặc biệt là trong các tình huống khẩn cấp. Tránh 10 lỗi này sẽ cải thiện được cơ hội thành công của bạn.

Là một quản trị viên hệ thống, tôi đã trải qua hơn 25 năm làm trong lĩnh vực công nghệ và đã nhìn thấy tất cả những thăng trầm của việc khắc phục sự cố và giải quyết vấn đề. Trong thời điểm nóng bức, khi căng thẳng và thất vọng đè nặng lên, sự tuyệt vọng có thể khiến nhân viên IT phải có những lựa chọn tồi tệ làm phức tạp thêm vấn đề và giải quyết chậm.

Cho dù cố gắng để chẩn đoán một thiết bị duy nhất hoặc đối phó với sự khẩn cấp như cúp điện toàn công ty, có những phương án tốt nhất mà chúng ta không làm để tình hình được tốt hơn. Với điều đó trong tâm trí, đây là 10 điều để tránh làm, vì vậy bạn có thể hạn chế rủi ro và giữ mọi thứ chạy trơn tru nhất có thể:

1. Làm việc một mình

Không có gì cô đơn hơn việc khắc phục sự cố nghiêm trọng của riêng bạn – đặc biệt là vào giữa đêm, hoặc giữa ngày bận rộn khi các đồng nghiệp của bạn bận làm những việc khác hoặc là vào một nơi khác. Nhiều nhân viên IT có suy nghĩ”đi một mình” nhưng khi những vấn đề nghiêm trọng đang được tiến hành thì đó là điều cuối cùng bạn cần.

Nhận sự hỗ trợ từ những người khác. Công ty của tôi luôn có cách liên lạc được với nhau, như là mở ra một group để có thể liên lạc với nhau cùng giải quyết vấn đề xảy ra.

Ngay cả khi bạn đang đối mặt với một vấn đề nhỏ, bạn dường như không thể đi đến đâu, hãy hỏi ý kiến ​​của một nhân viên khác hoặc tham gia một diễn đàn trực tuyến để chia sẻ ý tưởng với những người khác có thể làm việc hiệu quả hơn.

2. Xem thường những lỗi xảy ra

Khi một cái gì đó bị làm hỏng, có thể bạn sẽ nói, “Không có gì cả – chỉ cần sửa chữa nhanh thôi.” Đó có thể là một sai lầm rất lớn.  Khi cần người khác can thiệp vào giúp đỡ, thì cần phải nói với họ để nhanh chóng giải quyết.

Điều tệ nhất bạn có thể làm là đối mặt với một vấn đề lớn mà không ai biết phạm vi và mức độ của vấn đề. Điều đó sẽ làm giảm nghiêm trọng khả năng của bạn để sửa chữa nó đúng và kịp thời. Hãy trung thực và thẳng thắn, và nếu những sai lầm đã được thực hiện, hãy giữ chúng trong tầm kiểm soát. Đừng cố gắng giấu nguyên nhân gốc rễ nếu đó là lỗi của con người, vì nó sẽ chỉ làm cho tình hình tồi tệ hơn.

3. Quá tin tưởng vào những kết quả từ Google

Một sự thật là những nhân viên CNTT thường tin vào những “thông báo lỗi” tìm kiếm từ Google và áp dụng các khuyến nghị dựa trên nó. Kinh nghiệm đã chứng minh đây là một ý kiến ​​thật tệ hại. Internet có rất nhiều người có ý nghĩa (hoặc có thể là quản trị hệ thống) có câu trả lời cho mọi vấn đề có thể xảy ra. Cho dù câu trả lời thực sự đúng là một điều khác. Tôi đã nhìn thấy nhiều hơn chia sẻ của những người nghĩ rằng họ biết những gì họ đang làm những người nhấn mạnh nhất, nếu không phải tất cả, các vấn đề đã được gây ra bởi DNS hoặc các vấn đề chống virus. Không chính xác hoàn toàn cho nhiều vấn đề.

Không nên chấp nhận lời khuyên của họ theo mệnh giá. Tìm kiếm trang web đủ điều kiện để được hỗ trợ chứ không phải diễn đàn người dùng với người trả lời câu hỏi và trên hết là không bắt đầu thay đổi vì Google đã dẫn bạn đến một trang nào đó dường như có một cách mở ra nhiều hy vọng để giải quyết được vấn đề. Điều đó có thể chỉ làm mọi thứ tồi tệ hơn. Bạn có thể sẽ phải rút ra một loạt những thay đổi vô ích mà bạn gặp phải bởi vì của một người anh em của một người nào đó đã thử nó và cho biết nó đã hoạt động (nhưng nó được áp dụng cho một hệ điều hành từ tám năm trước).

4. Backup lại mọi thứ trước khi xử lý 

Khi cố gắng khắc phục sự cố, những thay đổi của bạn sẽ không thể quay lại. Tôi tìm ra cách này khó khăn khi làm việc trên một hệ thống Windows 7 của khách hàng và tôi đã thêm một khóa registry mà không cần sao lưu đăng ký. Sau đó tôi đã dành 6-8 giờ để khắc phục sự cố tôi gây ra, hãy để một mình khắc phục vấn đề ban đầu.

Luôn sao lưu tệp, cài đặt, dữ liệu cấu hình hoặc bất cứ thứ gì khác mà bạn đang thay đổi – ngay cả khi nó có nghĩa là chụp ảnh màn hình cài đặt ban đầu. Không bao giờ để mình ở lòng thương xót của số phận. Bạn nên luôn luôn có thể hoàn tác những gì bạn đã cố gắng.

5. Using the shotgun approach

Khi nói đến vấn đề IT, tôi cảm thấy hoảng sợ nhiều quản trị hệ thống cảm thấy. Chúng tôi muốn có được mọi thứ và chạy ASAP và tiết kiệm công việc của chúng tôi. Nhưng việc áp dụng một vài sửa lỗi ngay lập tức để cố gắng tối đa hóa cơ hội để giải quyết thực sự gây bất lợi cho nỗ lực của bạn.

Nếu bạn thực hiện ba hoặc bốn thay đổi đối với một hệ thống bị lỗi thì hãy khởi động lại nó và xem liệu nó có hoạt động như mong đợi không? Nếu có, đó là tất cả tốt và tốt, nhưng bạn sẽ không bao giờ biết chính xác những gì cố định vấn đề. Nếu không, bây giờ bạn đã thêm phức tạp hơn cho vấn đề và có thể mất nhiều thời gian để sửa nó.

Thực hiện một thay đổi duy nhất tại một thời điểm, sau đó cam kết thay đổi nói. Nếu nó không giúp bạn, hãy quay lại thay đổi.

6. Nhìn sự việc một cách rõ ràng

Tất cả chúng ta đều có lỗi trong thế giới IT. Một cái gì đó đã phá vỡ? Có thể đó là một cuộc tấn công, một nỗ lực độc hại bên trong, hoặc một lỗ hổng khai thác, chúng tôi có thể nghĩ. Hoặc mặt khác, có lẽ đó là do lỗi phần cứng.

Không quá nhanh. Tôi không thể cho bạn biết có bao nhiêu vấn đề hệ thống có thể được gây ra bởi một yếu tố rất đơn giản: thiếu không gian đĩa. Nó gây ra tất cả các loại vấn đề lạ kỳ điên rồ, từ các vấn đề xác thực đến các lỗi dịch vụ.

Điều này cũng áp dụng cho tất cả các vấn đề CNTT hàng ngày: mật khẩu hết hạn (có thể làm cho tài khoản dịch vụ thực sự hoạt động), quyền truy cập, giấy chứng nhận SSL hết hạn và các loại tương tự. Khi chức năng nghỉ, bắt đầu với những điều cơ bản của bức tranh tổng thể thay vì giả sử một số ảnh hưởng bên ngoài hoặc vấn đề phức tạp gây ra vấn đề.

7. Không giữ lại file log

Đây là một vấn đề đáng kể. Khi bạn cố gắng sửa chữa mọi thứ, hãy giữ lại bản ghi những gì bạn đã làm sẽ phải trả khoản cổ tức khổng lồ. Nó sẽ cho bạn một đường mòn để nhìn lại sau và giúp bạn tránh khỏi việc nhân đôi nỗ lực của bạn.

Tôi đã ở trong lĩnh vực này, làm việc lúc 4 giờ sáng để cố gắng phục hồi một máy chủ cơ sở dữ liệu chết, và có một bản ghi viết tay của cơ sở dữ liệu mà tôi làm việc đã được chứng minh vô giá. Tôi nhận ra rằng thật tẻ nhạt và mất thời gian để theo dõi các hoạt động hiện tại của bạn khi bạn muốn khắc phục sự cố ASAP nhưng bạn không phải tự làm bất cứ điều gì bằng cách bỏ qua sự cần thiết phải đăng nhập những gì bạn đang làm. Khi căng thẳng, thất vọng và nhầm lẫn đổ lên, bạn muốn ghi lại nơi bạn đã đến và những gì bạn đã làm, hãy tin tôi.

8. Không xem xét các hậu quả

Tất cả quá thường xuyên khi chúng tôi tập trung giải quyết một vấn đề công nghệ, chúng tôi không xem xét toàn bộ các chi tiết của giải pháp mà chúng tôi muốn thực hiện. Hiểu được bức tranh tổng thể là rất quan trọng để thành công.

Ví dụ, một thời gian trước tôi đã làm việc để hồi sinh một máy chủ Exchange không thành công mà chạy ra khỏi không gian đĩa. Tôi cần phải di chuyển một số cơ sở dữ liệu hộp thư sang một ổ ngoài để máy chủ có thể được kích hoạt trở lại.

Máy chủ đang được hỏi có một thẻ USB 2.0 có thể truyền dữ liệu với tốc độ tối đa 480 megabit / giây. Tôi glumly chấp nhận thực tế là các cơ sở dữ liệu hefty sẽ mất một thời gian để chuyển sang ổ đĩa ngoài.

Tôi đã nghĩ, tôi đã có thể nhận ra tôi có thể đã đi ra ngoài và mua một thẻ USB 3.0 cho hệ thống của tôi mà có thể truyền dữ liệu ở 5 gigabit / giây. Vâng, nó sẽ liên quan đến chuyến đi tới cửa hàng bộ phận máy tính cục bộ của tôi cũng như tắt máy chủ Exchange – nhưng hệ thống đó không vui khi bắt đầu. Và tôi đã có thể tiết kiệm rất nhiều, nhiều giờ bằng cách tiếp cận này chứ không chờ đợi quá trình truyền dữ liệu hiện tại chậm. Hãy nhanh nhẹn và suy nghĩ trước, thay vì làm việc với những hạn chế hiện tại của bạn.

Điều này cũng áp dụng cho nhiều yếu tố khác. Xem xét chi nhánh có nghĩa là nhìn thấy kết quả cuối cùng trên tất cả các khía cạnh của nỗ lực của bạn. Bạn phải khôi phục toàn bộ máy chủ và sẽ mất 24 giờ để làm như vậy? Bạn có thể khôi phục dữ liệu của ngày cuối cùng chứ không phải là mười năm để thông tin có thể trở lại làm việc ASAP?

Bạn có thể nhìn thấy nơi tôi đi với điều này. Giải pháp của bạn nên được áp dụng cho phạm vi của vấn đề và tác động trong tầm tay. Hãy cảm thấy sáng tạo và linh hoạt. Người dùng của bạn sẽ đánh giá cao nó.

9. Không giữ lại những tang vật gây ra lỗi

Tất cả những người trong chúng ta chỉ luôn muốn vấn đề cố định để chúng tôi có thể tiếp tục vấn đề tiếp theo. Tâm lý đó đảm bảo chúng ta sẽ phải đối mặt với những vấn đề tương tự nhiều lần. Luôn luôn giữ một phần tử sau khi xác định:

Có chuyện gì?
Chúng ta có thể làm gì tốt hơn?
Đây có phải là vấn đề có thể xảy ra lần nữa?
Nếu vậy, chúng ta có thể làm gì để ngăn chặn nó lần sau?
Đào tạo bổ sung có cần thiết không?
Làm thế nào chúng ta có thể có được đào tạo này?
Cần thêm các biện pháp tự vệ?
Làm thế nào chúng ta có thể đảm bảo tất cả các nhân viên có trách nhiệm biết về vấn đề này?
Tôi muốn nhấn mạnh rằng chỉ tay ngón tay và “trò chơi đổ lỗi” là phản tác dụng. Bước này nên được tiếp cận thông qua quan điểm của đội để đảm bảo sự thành công tốt nhất cho việc kinh doanh tiếp tục.

10. Không lưu trữ tài liệu

Số chín là vô nghĩa nếu điều này không được lưu trữ thành các văn bản, và tài liệu được cập nhật khi có sự thay đổi. Nên viết các tài liệu cần thiết để đảm bảo cùng một vấn đề không nảy sinh, và đảm bảo rằng tất cả nhân viên có trách nhiệm đều được đào tạo đủ để làm việc với những vấn đề này trong lần tiếp theo.

Người ta thay đổi vị trí hoặc rời bỏ công việc; công nghệ phát triển và hoạt động khác nhau, và người sử dụng hoặc yêu cầu kinh doanh thay đổi liên tục. Biết làm thế nào để xử lý các vấn đề đã biết đã bị cắt xén trong quá khứ – hoặc không còn là một  vấn đề lớn lao và do đó có thể được đưa ra tài liệu – là chìa khóa để đảm bảo bộ phận IT có thể làm việc để giải quyết các vấn đề một cách có ý nghĩa và chủ động.

error: Content is protected !!