工作總結(jié)
發(fā)表時(shí)間:2026-04-10[精選]技術(shù)員轉(zhuǎn)正工作總結(jié)。
入職三個(gè)月,轉(zhuǎn)正了。趁熱打鐵把這陣子干的活、踩的坑、攢下的經(jīng)驗(yàn)捋一捋。我不太會(huì)寫(xiě)那種漂亮話,就按時(shí)間順序,把幾個(gè)實(shí)實(shí)在在的事擺出來(lái)。
先說(shuō)那次凌晨的宕機(jī)。試用期第二周,凌晨?jī)牲c(diǎn)多,監(jiān)控報(bào)警——業(yè)務(wù)系統(tǒng)訪問(wèn)大面積超時(shí)。我從床上爬起來(lái),連VPN、跳板機(jī),心里罵了一句:怕什么來(lái)什么。先看負(fù)載,0.8,正常;CPU,20%,正常;內(nèi)存,剩余3G,正常。再查磁盤(pán)IO,也不高。那就怪了。繼續(xù)往下翻連接數(shù),發(fā)現(xiàn)已經(jīng)飆到上限了,而且每個(gè)連接的狀態(tài)都是“Locked”。順著鎖往上追,查到一條新上的統(tǒng)計(jì)SQL——開(kāi)發(fā)同事寫(xiě)了個(gè)大表關(guān)聯(lián),沒(méi)加索引,直接把核心業(yè)務(wù)表鎖死了。當(dāng)時(shí)我手動(dòng)kill掉那幾條慢查詢(xún),臨時(shí)把統(tǒng)計(jì)接口下線,業(yè)務(wù)在25分鐘后恢復(fù)。25分鐘里,有15分鐘在排查,10分鐘在執(zhí)行。事后我拉上開(kāi)發(fā)和產(chǎn)品,把執(zhí)行計(jì)劃打印出來(lái)貼在白板上,逐行看。問(wèn)題很明顯:測(cè)試環(huán)境數(shù)據(jù)量只有線上的1%,索引效果被完全掩蓋。我們定了一條規(guī)矩:所有多表關(guān)聯(lián)查詢(xún),必須先拿脫敏后的生產(chǎn)數(shù)據(jù)樣本在預(yù)發(fā)環(huán)境跑執(zhí)行計(jì)劃,DBA簽字才能上線。這事之后,我養(yǎng)成個(gè)習(xí)慣:每次變更前,先在腦子里過(guò)一遍——這操作最壞會(huì)怎樣?回滾怎么弄?告警閾值設(shè)了沒(méi)?
再說(shuō)一個(gè)看起來(lái)不起眼但差點(diǎn)出大事的。那次配合廠家換UPS輸出開(kāi)關(guān),斷電、驗(yàn)電、掛接地線,每一步都按規(guī)程來(lái)。合閘送電后,有一路設(shè)備頻繁重啟。用萬(wàn)用表量電壓,波動(dòng)不大;拿示波器抓波形,零地電壓峰值接近6V。查到最后,是配電柜接地銅排上一個(gè)M6螺栓沒(méi)擰緊,扭矩螺絲刀一測(cè),只有2.3Nm(標(biāo)準(zhǔn)是5Nm)。那個(gè)端子藏在幾根粗線后面,我驗(yàn)收時(shí)只看了顯眼的地方。問(wèn)題不大,后果不輕——電源在這種環(huán)境下長(zhǎng)期工作,壽命肯定打折。那天下午我花了兩小時(shí),把機(jī)柜里所有接地端子重?cái)Q一遍,還用熱成像掃了每個(gè)連接點(diǎn)。從那以后,我的巡檢清單上加了一條:關(guān)鍵電氣連接必須用扭矩螺絲刀復(fù)核,拍照留底。帶新同事看現(xiàn)場(chǎng)時(shí),我會(huì)專(zhuān)門(mén)指著那些角落說(shuō):別光看指示燈,螺絲才是鬼故事多發(fā)地。
日常的活其實(shí)沒(méi)那么刺激。每周兩次巡檢,看磁盤(pán)SMART數(shù)據(jù)、看日志有沒(méi)有異常報(bào)錯(cuò)、看備份是不是真能恢復(fù)——上個(gè)月我試著恢復(fù)了一個(gè)舊備份,發(fā)現(xiàn)有個(gè)腳本路徑寫(xiě)錯(cuò)了,恢復(fù)失敗。趕緊改了,并把備份恢復(fù)演練從季度一次改成月度一次。三個(gè)月下來(lái),累計(jì)處理工單18件,參與變更12次,沒(méi)出過(guò)人為事故。有幾次是小毛病:證書(shū)快過(guò)期了、磁盤(pán)慢扇區(qū)增多了、一個(gè)進(jìn)程的內(nèi)存泄漏了。這些事不寫(xiě)出來(lái)顯得沒(méi)分量,但說(shuō)實(shí)話,系統(tǒng)穩(wěn)定靠的就是把這些“小毛病”在變成大故障之前摁住。
說(shuō)個(gè)有點(diǎn)感觸的。項(xiàng)目沖刺那周,同時(shí)上三個(gè)模塊,我基本住值班室了。凌晨?jī)牲c(diǎn)剛做完存儲(chǔ)遷移,對(duì)講機(jī)喊:日志采集器掛了,數(shù)據(jù)積壓。跑過(guò)去一看,進(jìn)程僵死,重啟后反復(fù)崩潰。用strace跟蹤系統(tǒng)調(diào)用,發(fā)現(xiàn)它在寫(xiě)一個(gè)不存在的目錄——配置文件路徑里多了個(gè)空格。就這一個(gè)字符,折騰到凌晨四點(diǎn)。第二天早上,客戶(hù)那邊的運(yùn)維負(fù)責(zé)人打電話來(lái),說(shuō)昨天峰值扛住了,數(shù)據(jù)沒(méi)丟,謝謝。我靠在椅子上,窗外剛下過(guò)雨,心里沒(méi)什么激動(dòng),就一個(gè)念頭:?jiǎn)栴}解決了,而且下次我知道怎么更快。
- ?讀書(shū)筆記吧速成指南:
- 技術(shù)員思想總結(jié)?|?技術(shù)員年度總結(jié)?|?技術(shù)員工作總結(jié)?|?it技術(shù)員工作總結(jié)?|?技術(shù)員轉(zhuǎn)正工作總結(jié)?|?技術(shù)員轉(zhuǎn)正工作總結(jié)
試用期也暴露了自己不少短板。比如容器網(wǎng)絡(luò)那一塊,有次兩個(gè)pod之間通信超時(shí),我查了半天才發(fā)現(xiàn)是calico的MTU配置和底層物理網(wǎng)卡不匹配。這塊知識(shí)不扎實(shí),以后得補(bǔ)。另外,文檔寫(xiě)得還是不夠細(xì)——有時(shí)候自己看明白,同事照著做就卡住。下一步我打算:6月底前,把備份恢復(fù)演練從季度改成月度,并寫(xiě)一個(gè)傻瓜式操作指南;9月底前,把所有核心服務(wù)的磁盤(pán)、證書(shū)、進(jìn)程巡檢腳本化,不用人工去盯;年底前,整理一份《常見(jiàn)故障排查手冊(cè)》,把“現(xiàn)象→排查步驟→根因→解決”寫(xiě)成模板,給新同事少走彎路。
三個(gè)月不長(zhǎng),但夠我掂量出自己的斤兩。技術(shù)員這崗位,不靠說(shuō),靠出了問(wèn)題能頂上去、能查清楚、能從根本上解決。以上是我轉(zhuǎn)正期間的實(shí)際工作情況,請(qǐng)領(lǐng)導(dǎo)審閱。
- 推薦閱讀: 設(shè)備技術(shù)員工作總結(jié) 電儀技術(shù)員工作總結(jié)(匯集4篇) 技術(shù)員思想總結(jié)(收藏十篇) 財(cái)務(wù)員的轉(zhuǎn)正工作總結(jié) 電聲技術(shù)員工作總結(jié)(合集9篇) 機(jī)電技術(shù)員工作總結(jié)(合集16篇)
- 欲了解工作總結(jié)網(wǎng)的更多內(nèi)容,可以訪問(wèn):工作總結(jié)