Refaktoring starej priemyselnej aplikácie – kedy má zmysel a ako ho urobiť bez rizika… - Refaktoring starej…

Technické zhrnutie

Kľúčové body článku:

Článok uvádza, že refaktoring priemyselnej aplikácie má zmysel vtedy, keď náklady a neistota spojené s drobnými zmenami rastú rýchlejšie než ich obchodná hodnota. Kľúčové je rozlišovať medzi úpravou štruktúry a technickou zmenou, ktorá ovplyvňuje proces alebo bezpečnosť.

Refaktoring starej aplikácie sa týka kontinuity výroby, nákladov a zodpovednosti, nielen kvality kódu.
Riziko rastie, keď zmena ovplyvňuje signály, stavy, poradie činností alebo podmienky prechodu procesu.
Zdanlivo technické zmeny môžu zmeniť štart, stop, reset chýb, reakciu na výpadok napájania a stratu komunikácie.
Ak je potrebné opätovne potvrdiť sekvencie alebo reakcie ochranných obvodov, už nejde len o bežnú údržbu kódu.
Bezpečná refaktorizácia si vyžaduje vymedzenie hraníc zmeny, akceptačných kritérií a posúdenie rizík procesu.

Prečo je táto téma dnes dôležitá

Refaktoring starej priemyselnej aplikácie už dávno nie je otázkou estetiky kódu ani pohodlia pri údržbe. Dnes ide o rozhodnutie, ktoré ovplyvňuje kontinuitu výroby, predvídateľnosť nákladov a rozsah zodpovednosti na strane vlastníka systému. V mnohých závodoch sa riadiace aplikácie, operátorské nástroje a komunikačné vrstvy vyvíjali celé roky bez jednej ucelenej architektúry, často okolo zariadení, knižníc a integračných mechanizmov, ktorých podpora je obmedzená alebo už skončila. Takýto stav môže byť určitý čas tolerovaný, ale len dovtedy, kým každá ďalšia zmena nezačne stáť viac než samotná funkcionalita, ktorú má priniesť. Vtedy už nejde o otázku, či sa starej aplikácie dotknúť, ale či má organizácia jej správanie v prevádzkových podmienkach stále pod kontrolou.

Dôležitosť tejto témy vyplýva z toho, že v priemyselných systémoch sa technologický dlh veľmi rýchlo mení na prevádzkový dlh. Ak je aplikácia ťažko reprodukovateľná, závisí od jednotlivcov, nemá spoľahlivé regresné testy alebo sa v jej logike miešajú výrobné funkcie s funkciami súvisiacimi s bezpečnosťou a diagnostikou, každý incident bude drahší než podobný problém v kancelárskom systéme. Dôsledkom nie je len odstávka. Pribúdajú náklady na prácu údržby, riziko nesprávnych obchádzok používaných pod časovým tlakom, problém preukázať náležitú starostlivosť po zmene a aj ťažkosti s rozlíšením, čo bolo pôvodnou poruchou a čo následkom zásahu projektového tímu. Pre manažéra a vlastníka produktu je praktické kritérium jednoduché: ak čas a neistota pri nasadzovaní ďalších drobných zmien rastú rýchlejšie než ich obchodná hodnota, aplikácia sa dostala do stavu, v ktorom treba o refaktoringu rozhodnúť vedome, a nie to odkladať až do prvej kritickej poruchy.

Najviac chýb vzniká vtedy, keď sa refaktoring považuje za modernizáciu „bez vplyvu na proces“, hoci v skutočnosti mení spôsob, akým systém prijíma rozhodnutia. V praxi stačí aj zdanlivo malý zásah: výmena komunikačného komponentu, prestavba plánovania úloh, zmena logiky ukladania údajov zo snímačov do vyrovnávacej pamäte alebo úprava sekvencie spúšťania po reštarte. Na papieri ide o technické upratovanie. Vo výrobe sa tým však môže zmeniť okamih vyslania signálu, poradie uvoľnenia blokovaní, reakcia po strate komunikácie alebo správanie aplikácie po výpadku napájania. Práve tu sa téma refaktoringu mení na praktické hodnotenie rizika zmien: nejde o to, či je kód „lepší“, ale či sa stroj, linka alebo pracovisko po zmene stále správajú predvídateľne v normálnych stavoch, pri poruchách aj po opätovnom spustení.

Dobrým testom zrelosti rozhodnutia je overiť si, či tím dokáže určiť hranicu medzi zmenou vnútornej štruktúry aplikácie a zmenou funkcie dôležitej pre proces alebo bezpečnosť. Ak túto hranicu nemožno opísať na úrovni signálov, stavov a podmienok prechodu, projekt je rizikový bez ohľadu na kvalitu dodávateľa. V priemyselnom prostredí sú obzvlášť citlivé situácie, keď sa aplikácia podieľa na sekvencii štartu, zastavenia, resetu chýb, potvrdzovania alarmov alebo spolupracuje so systémami odpojenia energie a blokovaniami. V takom prípade už nejde len o otázku architektúry softvéru, ale aj o ochranu pred neočakávaným spustením a o to, či analýza zahŕňa aj elektrickú inštaláciu, logiku riadenia a väzby medzi zariadeniami. Práve v tomto bode prestáva byť zdanlivo lokálny refaktoring informatickou úlohou a stáva sa technickou zmenou, ktorá si vyžaduje plný rozhodovací režim.

Odkaz na normatívne požiadavky má význam až v tejto fáze, pretože normy nenahradia projektové rozhodnutie, ale pomáhajú vymedziť jeho rozsah. Ak môže zmena ovplyvniť podmienky spustenia, zastavenia, obnovenia prevádzky po poruche alebo ochranné opatrenia, treba ju posudzovať ako zmenu rizika, nie ako bežnú údržbu kódu. Ak sa zásah týka logiky spolupracujúcej s odpojením energie, blokovaniami alebo sekvenciou bezpečného prístupu, prirodzene sa otvára aj oblasť požiadaviek týkajúcich sa ochrany pred neočakávaným spustením. Z hľadiska zodpovednosti teda nie je najdôležitejšie samotné „či refaktorovať“, ale či organizácia vie preukázať, že pozná hranice zmeny, má akceptačné kritériá založené na správaní procesu a dokáže odlíšiť usporiadanie systému od úpravy, ktorá si vyžaduje úplnú identifikáciu nebezpečenstiev podľa ISO 12100, plné hodnotenie rizika a koordináciu s návrhom inštalácie aj testami na zariadení.

Kde najčastejšie rastú náklady alebo riziko

Najväčší nárast nákladov pri refaktorizácii starej priemyselnej aplikácie len zriedka vyplýva zo samotného kódu. Zdrojom problému býva spravidla nesprávne posúdenie zmeny: tím ju považuje za upratanie štruktúry programu, hoci sa v skutočnosti mení správanie systému v čase, poradie operácií alebo podmienky prechodu medzi stavmi. Vo výrobnom prostredí má takýto omyl priamy dopad na projekt. Harmonogram prestáva zodpovedať skutočnému rozsahu, testy sa plánujú podľa IT funkcionality, nie podľa priebehu procesu, a zodpovednosť za výsledok sa rozplýva medzi údržbou, automatizáciou a dodávateľom softvéru. Praktické kritérium je tu jednoduché: ak je po zmene potrebné znovu potvrdiť sekvenciu spustenia, zastavenia, obnovenia prevádzky po poruche alebo reakciu na signály z ochranných obvodov, nejde už v organizačnom zmysle o „bezpečnú refaktorizáciu“, ale o zmenu, ktorá môže vytvárať riziko pre výrobu a môže si vyžadovať iný režim schvaľovania.

Druhou typickou oblasťou rastu nákladov je projektové rozhodnutie prijaté bez úplného obrazu závislostí. Staré priemyselné aplikácie sú často prepojené s konfiguráciou riadiaceho systému, akčných členov, vizualizácie, archivácie dát a operátorských postupov. V dokumentácii to vyzerá ako jeden systém, v praxi však ide o vrstvy rozvíjané celé roky rôznymi tímami. Refaktorizácia, ktorá má zlepšiť čitateľnosť kódu alebo uľahčiť ďalšiu údržbu, môže nenápadne zmeniť význam oneskorení, podmienok blokovania, predvolených hodnôt po reštarte alebo spôsobu spracovania chyby komunikácie. Dôsledkom potom nie je len technická oprava, ale aj cena odstávok, dodatočných skúšok na zariadení a sporov o to, či chyba existovala už predtým, alebo ju priniesla až zmena. Preto sa pred rozhodnutím oplatí posúdiť nie samotnú veľkosť úpravy, ale počet a kritickosť styčných bodov: koľko signálov, receptúr, prevádzkových režimov a prevádzkových obchádzok závisí od časti kódu určenej na prestavbu. Čím viac je takýchto bodov, tým menší zmysel má refaktorizácia „popri“ inej úlohe.

V praxi sú obzvlášť nákladné projekty, pri ktorých tím odhalí skutočné požiadavky až počas uvádzania do prevádzky. Typickým príkladom je prestavba sekvenčného modulu, ktorý podľa opisu „robí to isté, len čistejšie“. Po nasadení sa však ukáže, že predchádzajúca verzia obsahovala nezdokumentované správania kompenzujúce nedokonalosti zariadenia: krátke podržanie signálu, toleranciu voči oneskorenému snímaču, špecifické poradie kvitovania alarmu alebo podmienku, od ktorej závisí možnosť vstupu servisu. V kóde to vyzeralo ako chyba alebo technický dlh, no pre proces to bol stabilizačný prvok. Ak refaktorizácia takéto mechanizmy odstráni bez rozpoznania ich funkcie, náklady sa objavia okamžite: rastie počet zásahov po spustení, predlžuje sa čas prevzatia a logiku treba obnovovať pod tlakom prevádzky závodu. Preto treba zmysel refaktorizácie posudzovať aj podľa možnosti zrekonštruovať správanie súčasného systému. Ak organizácia nemá záznam udalostí, spoľahlivé opisy prevádzkových režimov a testovacie scenáre založené na reálnom procese, treba najprv vytvoriť základ na posúdenie a až potom rozhodovať o prestavbe.

Táto téma priamo prechádza do praktického hodnotenia rizika podľa ISO 12100 vtedy, keď úprava ovplyvňuje ochranné funkcie, sekvencie bezpečného prístupu, riadenie pohybu akčných členov alebo správanie inštalácie po výpadku a obnovení napájania. V takom rozsahu sa náklady na chybu neobmedzujú len na programátorské opravy, pretože vzniká aj otázka zodpovednosti za pripustenie zmeny do prevádzky. Ak aplikácia spolupracuje s hydraulickými, pneumatickými systémami alebo s riešeniami, ako je ovládanie oboma rukami, hranica medzi refaktorizáciou a technickou zmenou sa ešte viac zužuje a vyžaduje preverenie, či neboli narušené projektové predpoklady ochranných opatrení. Práve tu je opodstatnené odvolať sa na systematické metódy posudzovania rizika vrátane prístupu používaného v praxi na základe ISO/TR 14121-2 a pri hydraulických systémoch aj na projektové požiadavky usporiadané normou STN EN ISO 4413. Nejde o formalizmus pre formalizmus, ale o jednoduché rozhodovacie pravidlo: ak môže mať zmena vplyv na bezpečnosť procesu alebo obsluhy, jej náklady treba počítať spolu s validáciou, skúškami na zariadení a režimom zodpovednosti, nie iba s časom práce programátora.

Ako k téme pristúpiť v praxi

V praxi sa zmysel refaktorizácie starej priemyselnej aplikácie neposudzuje podľa technologickej atraktívnosti zmeny, ale podľa toho, či sa zároveň dá znížiť prevádzkové riziko a udržať zmena pod kontrolou počas nasadenia. Pre manažéra a vlastníka produktu to znamená jednoduchú zmenu pohľadu: nejde o otázku, či sa kód „oplatí upratať“, ale či súčasný stav aplikácie reálne sťažuje údržbu, testovanie, odstraňovanie porúch alebo zavádzanie ďalších úprav v súlade s požiadavkami. Ak je odpoveď kladná, refaktorizácia dáva zmysel, ale len v takom rozsahu, ktorý možno oddeliť od chodu výroby a vyhodnotiť podľa merateľných dôsledkov. Dobrým rozhodovacím kritériom je porovnanie dvoch nákladov: nákladov na ponechanie aplikácie v súčasnom stave, vrátane prestojov, času diagnostiky, závislosti od jednotlivcov a rizika chybnej zmeny, a nákladov na riadenú prestavbu spolu s testami, validáciou a uvedením do prevádzky. Bez takéhoto porovnania sa projekt zvyčajne vymkne spod kontroly, pretože tím financuje upratovanie kódu z rozpočtu určeného na funkcionalitu a zodpovednosť za dôsledky na zariadení zostáva nejasná.

Preto by prvým rozhodnutím nemalo byť „prepíšeme“ alebo „ponecháme“, ale určenie hranice zmeny. Pri vyspelom prístupe sa oddeľuje časť, ktorá sa týka výlučne štruktúry softvéru, od časti, ktorá ovplyvňuje logiku procesu, sekvencie spustenia, zastavenia, prevádzkové režimy, komunikáciu s pohonmi a správanie po výpadku napájania. Toto rozlíšenie má priamy dopad na náklady aj organizáciu práce. Zmena obmedzená na vrstvu upravujúcu štruktúru kódu sa môže realizovať v kratšom cykle a s menším zapojením údržby. Zmena, ktorá zasahuje do správania stroja alebo linky, si už vyžaduje plán testov na zariadení, servisné okno, postup návratu k pôvodnému stavu a jednoznačné určenie, kto schvaľuje uvedenie do prevádzky. Zmysel má pritom merať nielen čas programátorských prác, ale aj čas potrebný na obnovu systému po neúspešnom pokuse, počet oblastí zahrnutých do regresného testovania a čas potrebný na diagnostiku odchýlky po spustení. Práve tieto ukazovatele ukazujú, či refaktoring skutočne znižuje riziko projektu, a nielen zlepšuje komfort práce vývojového tímu.

Praktický príklad je pre staršie riadiace aplikácie typický: kód obsahuje opakovane kopírované časti zodpovedné za blokovanie pohybu, spracovanie alarmov a prechody medzi ručným a automatickým režimom. Tím ich chce zjednotiť, pretože súčasné usporiadanie sťažuje rozvoj a spôsobuje rozdiely medzi pracoviskami. Takéto rozhodnutie má zmysel až po overení, či zjednotenie nezmení podmienky, za ktorých akčný člen dostane povolenie na pohyb, a či sa po reštarte riadiaceho systému neobjaví iná sekvencia obnovy stavu. Ak aplikácia riadi aj ventily, pohony alebo systémy s akumulovanou energiou, potom aj zdanlivo „vnútorný“ refaktoring môže prejsť do oblasti hodnotenia rizika zmien a vyžadovať analýzu ochrany pred neočakávaným spustením. V takom prípade je rozumnou praxou vykonávať refaktoring po etapách: najprv reprodukovať správanie v testovacom prostredí, potom vyčleniť moduly bez zmeny logiky a následne vykonať overenie na zariadení s pripraveným scenárom návratu k pôvodnému stavu. Tým sa obmedzuje prevádzková zodpovednosť a umožňuje prerušiť nasadenie skôr, než sa problém prejaví vo výrobe.

Až v tejto fáze je potrebné normatívne východisko, pretože normy nenahrádzajú technické rozhodnutie, ale pomáhajú určiť okamih, keď zmena prestáva byť iba programátorskou prácou. Ak refaktoring ovplyvňuje ochranné opatrenia, podmienky bezpečného prístupu, odpojenie energie alebo správanie systémov po zastavení a opätovnom spustení, prirodzene vstupuje do oblasti praktického hodnotenia rizika zmien, vykonávaného systematicky aj s využitím prístupu známeho z ISO/TR 14121-2. Keď sa objaví riziko neočakávaného spustenia, treba preveriť nielen samotný kód, ale aj logiku odpojenia a obnovenia energie, čo priamo vedie k témam spájaným s ISO 14118. Ak je aplikácia navyše prepojená s hydraulikou alebo pneumatikou, hodnotenie nesmie obísť projektové predpoklady týchto systémov, pretože chybná riadiaca sekvencia môže narušiť ich bezpečnú funkciu bez ohľadu na správnosť samotného programu; vtedy je opodstatnené vychádzať aj z požiadaviek, ktoré usmerňujú navrhovanie hydraulických systémov. V praxi to znamená jediné: o rozsahu refaktoringu nerozhoduje elegancia riešenia, ale hranica zodpovednosti za bezpečné správanie inštalácie po zmene.

Na čo si dať pozor pri nasadení

Nasadenie refaktoringu starej priemyselnej aplikácie je moment, v ktorom sa aj správne architektonické rozhodnutie môže zmeniť na prevádzkový problém. Zmysel celého zámeru sa končí tam, kde zmena síce zlepší kód, ale zhorší predvídateľnosť fungovania inštalácie alebo rozšíri zodpovednosť tímu nad rámec toho, čo bolo identifikované a schválené. Najčastejšou chybou je považovať nasadenie za obyčajné publikovanie novej verzie. Vo výrobnom prostredí nie je dôležité len to, či aplikácia funguje, ale aj to, či sa po zmene rovnako správajú všetky prechodové stavy: spustenie po výpadku napájania, reštart komunikácie, obnova receptúr, spracovanie alarmov, blokovaní a ručných režimov. Praktické kritérium je jednoduché: ak tím nevie jednoznačne opísať, ktoré správania musia po nasadení zostať nezmenené, znamená to, že ešte nie sú splnené podmienky na bezpečné spustenie.

Vo fáze rozhodovania o nasadení treba odlíšiť technicky vratnú zmenu od zmeny, ktorá po spustení vytvorí nový východiskový stav a sťaží návrat. Má to priamy vplyv na náklady aj harmonogram. Refaktoring, ktorý si vyžaduje súčasnú aktualizáciu riadiacich jednotiek, vizualizácie, dátového servera a rozhraní na nadradené systémy, už nie je samostatnou programátorskou úlohou; stáva sa koordinovanou výrobnou zmenou s viacerými bodmi zlyhania. Preto sa pred nasadením oplatí prijať kritérium schválenia založené nie na vyhlásení „testy prešli“, ale na schopnosti riadene vrátiť zmenu späť v čase prijateľnom pre proces. Ak neexistuje dôveryhodný postup návratu, nie je ani dôvod tvrdiť, že riziko bolo zvládnuté. V praxi je vhodné merať nie abstraktnú „kvalitu nasadenia“, ale ukazovatele, ako sú čas obnovenia predchádzajúcej verzie, počet rozhraní závislých od zmeny a počet funkcií, ktorých správnosť možno overiť na inštalácii bez zásahu do výroby.

Dobrým príkladom je situácia, keď refaktoring usporiada obsluhu výnimiek a chybových hlásení, no zároveň zmení poradie inicializácie po reštarte systému. Na testovacom pracovisku vyzerá všetko správne, pretože zariadenia sú dostupné okamžite a proces nebeží pod zaťažením. V prevádzke však ten istý kód môže spustiť sekvenciu v inom okamihu než doteraz, čo vedie k strate synchronizácie s pohonmi, nesprávnej interpretácii signálov pripravenosti alebo k zastaveniu dávky materiálu v medzistave. Takýto incident nemusí znamenať poruchu v technickom zmysle, ale vytvára náklady na odstávku, odpad, opätovný rozbeh a dodatočnú zodpovednosť za rozhodnutie o obnovení prevádzky. Práve tu sa téma refaktoringu mení na praktické posúdenie rizika zmien: nie vtedy, keď je zmena veľká, ale vtedy, keď jej dôsledky nemožno obmedziť len na softvérovú vrstvu.

Hranica zodpovednosti je ešte zreteľnejšia tam, kde aplikácia ovplyvňuje ochranné funkcie, logiku povolenia pohybu, odľahčovacie sekvencie, zastavenie a opätovné spustenie po poruche. V takom prípade už nestačí porovnanie verzií kódu ani funkčný test vykonaný integrátorom. Je potrebné systematicky posúdiť, či zmena mení úroveň rizika a či nenarúša predpoklady bezpečnej prevádzky stroja alebo zariadenia. To je prirodzený moment vstupu do oblasti hodnotenia rizika podľa ISO 12100 a postupov používaných pri posudzovaní rizika zmien, pričom pri zložitejších prípadoch môže byť užitočný aj metodický prístup známy z ISO/TR 14121-2. Ak aplikácia riadi hydraulické alebo pneumatické systémy, treba navyše overiť, či nová logika nemení podmienky bezpečného riadenia energie a poradie pohybov; vtedy sú dôležité aj konštrukčné požiadavky platné pre tieto systémy, nielen správnosť samotného programu. Pre projektový tím to znamená jediné: nasadenie možno považovať za pripravené až vtedy, keď je rozsah technickej, prevádzkovej a súladovej zodpovednosti pomenovaný ešte pred spustením, a nie až po prvom incidente.

Refaktoring starej priemyselnej aplikácie – kedy má zmysel a ako ho urobiť bez rizika pre výrobu?

Dáva to zmysel vtedy, keď náklady a neistota pri zavádzaní drobných zmien rastú rýchlejšie než ich obchodná hodnota. Je to signál, že technologický dlh začína ovplyvňovať kontinuitu výroby a prevádzkové náklady.

Ak zmena ovplyvňuje signály, stavy, podmienky prechodu alebo sekvencie spustenia, zastavenia a obnovenia prevádzky. Vtedy už nejde len o otázku architektúry, ale o technickú zmenu vyžadujúcu posúdenie rizika.

Najčastejšie tam, kde sa v čase mení správanie systému: plán úloh, poradie operácií, logika ukladania do vyrovnávacej pamäte, reakcia po strate spojenia alebo po výpadku napájania. Aj malý zásah môže potom zmeniť predvídateľnosť prevádzky stroja alebo linky.

Je potrebné jasne vymedziť hranicu medzi zmenou štruktúry aplikácie a zmenou funkcie podstatnej pre proces alebo bezpečnosť. Kritériá prijatia by mali vychádzať zo správania procesu a skúšky by mali zahŕňať aj normálne stavy, poruchové stavy a opätovné spustenie.

Ak zásah zahŕňa logiku súvisiacu so spustením, zastavením, resetovaním chýb, blokovaniami, odpojením energie alebo bezpečným prístupom. V takých prípadoch treba zmenu posudzovať ako zmenu rizika, nie ako bežnú údržbu kódu.

Zdieľať: LinkedIn Facebook

Kľúčové body článku:

Prečo je táto téma dnes dôležitá

Kde najčastejšie rastú náklady alebo riziko

Ako k téme pristúpiť v praxi

Na čo si dať pozor pri nasadení

Refaktoring starej priemyselnej aplikácie – kedy má zmysel a ako ho urobiť bez rizika pre výrobu?

Kedy má refaktorizácia zmysel?

Kedy refaktorizácia prestáva byť len upratovaním kódu?

Kde sa najčastejšie vyskytuje riziko pre výrobu?

Ako obmedziť riziko pri refaktorizácii?

Kedy je potrebné úplné posúdenie rizika?

Related articles (Pre inžinierov)

Technický bulletin Engineering Shield