Автоматизација: иднината на науката за податоци и машинското учење?

Машинското учење е еден од најголемите достигнувања во историјата на компјутерите и сега се смета дека може да игра важна улога во областа на големите податоци и аналитиката. Големата анализа на податоци е огромен предизвик од гледна точка на претпријатието. На пример, активностите како што се разбирање на голем број различни формати на податоци, анализа на подготовка на податоци и филтрирање на излишни податоци може да бидат интензивни за ресурси. Регрутирањето специјалисти за научници за податоци е скап предлог и не е средство за цел за секоја компанија. Експертите веруваат дека машинското учење може да автоматизира многу од задачите поврзани со аналитиката - и рутински и сложени. Автоматското машинско учење може да ослободи значителни ресурси што би можеле да се искористат за посложена и иновативна работа. Се чини дека машинското учење постојано се движи во оваа насока.

Автоматизација во контекст на информатичката технологија

Во ИТ, автоматизацијата е поврзување на различни системи и софтвер, овозможувајќи им да извршуваат специфични задачи без човечка интервенција. Во ИТ, автоматизираните системи можат да извршуваат и едноставни и сложени работи. Пример за едноставна работа може да биде интегрирање на формулари со PDF датотеки и испраќање документи до вистинскиот примач, додека обезбедувањето резервни копии надвор од страницата може да биде пример за сложена работа.

За да ја извршите својата работа правилно, треба да програмирате или да дадете јасни упатства за автоматизираниот систем. Секој пат кога е потребен автоматизиран систем за да се измени опсегот на својата работа, програмата или сетот инструкции треба да се ажурира од некого. Иако автоматизираниот систем е ефикасен во својата работа, грешки може да се појават од различни причини. Кога се појавуваат грешки, основната причина треба да се идентификува и поправи. Јасно е дека за да ја заврши својата работа, автоматизираниот систем е целосно зависен од луѓето. Колку е покомплексна природата на работата, толку е поголема веројатноста за грешки и проблеми.

Вообичаен пример за автоматизација во ИТ индустријата е автоматизација на тестирање на веб-базирани кориснички интерфејси. Случаите за тестирање се внесуваат во скриптата за автоматизација и корисничкиот интерфејс се тестира соодветно. (За повеќе за практичната примена на машинско учење, видете Машинско учење и Hadoop во Откривање измами од следната генерација.)

Аргументот во корист на автоматизацијата е дека извршува рутински и повторливи задачи и ги ослободува вработените да прават посложени и покреативни задачи. Меѓутоа, исто така се тврди дека автоматиката исклучила голем број задачи или улоги што претходно ги извршувале луѓето. Сега, со учење на машинско учење во различни индустрии, автоматизацијата може да додаде нова димензија.

Иднината на автоматското машинско учење?

Суштината на машинското учење е способноста на системот постојано да учи од податоците и да се развива без човечка интервенција. Машинското учење е способно да дејствува како човечки мозок. На пример, моторите за препораки на страниците за е-трговија можат да ги проценат уникатните преференции и вкусови на корисникот и да дадат препораки за најсоодветните производи и услуги од кои можете да изберете. Со оглед на оваа способност, машинското учење се смета за идеално за автоматизирање на сложени задачи поврзани со големи податоци и анализи. Ги надмина главните ограничувања на традиционалните автоматизирани системи кои не дозволуваат човечка интервенција на редовна основа. Постојат повеќе студии на случаи кои ја покажуваат способноста на машинското учење да изведува сложени задачи за анализа на податоци, за што ќе се дискутира подоцна во овој труд.

Како што веќе беше забележано, аналитиката за големи податоци е предизвикувачки предлог за бизнисите, кои можат делумно да се делегираат на системите за машинско учење. Од деловна перспектива, ова може да донесе многу придобивки, како што се ослободување на ресурсите за наука на податоци за покреативни и критични задачи на мисијата, поголем обем на работа, помалку време за завршување на задачите и исплатливост на трошоците.

Студија на случај

Во 2015 година, истражувачите од МИТ започнаа да работат на алатка за наука на податоци која може да создаде модели за предвидливи податоци од голема количина сурови податоци користејќи техника наречена алгоритми за синтеза на длабоки карактеристики. Научниците тврдат дека алгоритмот може да ги комбинира најдобрите карактеристики на машинското учење. Според научниците, тие го тестирале на три различни групи на податоци и го прошируваат тестирањето за да вклучат повеќе. Во трудот што треба да се претстави на Меѓународната конференција за наука и анализа на податоци, истражувачите Jamesејмс Макс Кантер и Каyanан Верамачанени рекоа: „Користејќи автоматски процес на подесување, го оптимизираме целиот пат без човечка вклученост, овозможувајќи му да се генерализира на различни сетови на податоци“.

Ајде да ја разгледаме сложеноста на задачата: алгоритмот го има она што е познато како способност за автоматско прилагодување, со чија помош може да се добијат или да се извлечат сознанија или вредности од сурови податоци (како што се возраста или полот), по што предвидливите податоци може да се креираат модели. Алгоритмот користи сложени математички функции и теорија на веројатност наречена Гаусова копула. Затоа е лесно да се разбере нивото на сложеност со кое може да се справи алгоритмот. Оваа техника има освоено и награди на натпревари.

Машинското учење може да ја замени домашната задача

Во целиот свет се дискутира дека машинското учење може да замени многу работни места, бидејќи извршува задачи со ефикасност на човечкиот мозок. Всушност, постои одредена загриженост дека машинското учење ќе ги замени научниците за податоци и се чини дека постои основа за таква загриженост.

За просечниот корисник кој нема вештини за анализа на податоци, но има различни степени на аналитички потреби во нивниот секојдневен живот, не е изводливо да се користат компјутери што можат да анализираат огромен обем на податоци и да обезбедат податоци за анализа. Сепак, техниките за обработка на природен јазик (НЛП) можат да го надминат ова ограничување со тоа што ги учат компјутерите да го прифаќаат и обработуваат природниот човечки јазик. На овој начин, на просечниот корисник не му се потребни софистицирани аналитички функции или вештини.

IBM верува дека потребата за научници за податоци може да се минимизира или елиминира преку нејзиниот производ, Платформата за анализа на природни јазици Вотсон. Според Марк Атшулер, потпретседател за аналитика и деловна интелигенција во Вотсон, „Со когнитивен систем како Вотсон, само поставете го вашето прашање - или ако немате прашање, само испраќајте ги вашите податоци и Вотсон може да ги погледне и заклучете што можеби сакате да знаете. “

Заклучок

Автоматизацијата е следниот логичен чекор во машинското учење и веќе ги доживуваме ефектите во секојдневниот живот-страници за е-трговија, предлози за пријатели на Фејсбук, предлози за мрежа на LinkedIn и рангирање на пребарување Airbnb. Со оглед на дадените примери, нема сомнение дека ова може да се припише на квалитетот на излезот произведен од автоматизираните системи за машинско учење. И покрај сите квалитети и придобивки, идејата машинското учење да предизвика огромна невработеност изгледа малку претерана реакција. Машините ги заменуваат луѓето во многу делови од нашиот живот со децении, но луѓето еволуираа и се прилагодија за да останат релевантни во индустријата. Според гледиштето, машинското учење со сите негови нарушувања е само уште еден бран на кој луѓето ќе се прилагодат.


Време на објавување: 03.08.2021 година