Bigdata. Деректер
қорының негіздері
Үлкен деректер (ағыл. Big Data, [ˈbɪɡ
ˈdeɪtə]) дегеніміз - ақпаратты талдауға, жүйелі түрде шығаруға
немесе деректерді өңдеудің дәстүрлі қолданбалы бағдарламалық
жасақтамасымен өңделуге тым үлкен немесе күрделі деректер жиынымен
жұмыс істеуге арналған тәсілдерді зерттейтін саласы. Деректерді
талдағанда көптеген кейстерді зерттеу, немесе кейстердің
аттрибуттерді көбею, зерттеудің жоғары анықтығына
жеткізеді.[1] Үлкен
деректер деректерді талдау, деректерді сақтау, ақпаратты іздеу,
визуалдауда және тағы басқа салаларында қолданылады. Үлкен
деректердің негізгі концепті volume (деректердің үлкен көлемі),
variety (әртүрлі ақпараттың түрлерін талдау) және velocity (жылдам
өсетін деректердің көлемі).
Үлкен деректер саласы ауқым,
алуантүрлілік, жылдамдық, деректердің дұрыстығы, жинақталған
ақпараттардың құндылығы сияқты белгілермен
сипатталады.
Көп жағдайда үлкен деректермен
жасалатын жұмысқа өңделмеген деректерді жинастырудан қолдануға
жарамды ақпарат алуға дейінгіқалыпты жұмыс процесі
кіреді.
Үлкен деректермен жұмыс
жасаудағы негізгі мақсат – бұл олардың негізінде іс жүзінде қолдану
үшін құнды аналитикалық тұжырымдар
алу.
Негізінде үлкен деректер
барлық мүдделі тараптар үшін қолжетімді бола бастауы тиіс, бұл
олардың өз бетінше қолдануға есептелген теңгерілетін визуализация
және бизнес-сараптама құралдарының көмегімен деректер пакетін жеңіл
әрі жылдам зерттеп-білулеріне мүмкіндік береді.Сараптама түріне
байланысты, ақырғы пайдаланушыларға статикалық «болжамдар»
(болжамды сараптама жағдайында) түріндегі дайын нәтижелер немесе
ұсынылатын іс-әрекеттер (белгіленген сараптама жағдайында) берілуі
мүмкін.
Үлкен деректер бизнестің
көптеген салаларында кеңінен қолданыс тапқан. Оларды денсаулық
сақтау, телекоммуникация, сауда, логистика салаларында, қаржы
компанияларында, сонымен қатар мемлекеттік басқаруда
пайдаланады.
Үлкен деректер деген не?
Деректер күнделікті және көп мөлшерде шығарылады.
Жинақталған деректерді сәйкесінше сақтау және жақсы нәтиже алу үшін
оларды талдау маңызды. Google, Facebook күн сайын көптеген
мәліметтер жинайды. Деректерді ұйымдастыру және оларды талдау
ұйымға пайда әкелуі мүмкін. Банкте клиент туралы ақпаратты,
транзакцияларды, клиенттер мәселелерін түсіну үшін деректерді
талдау қажет. Осы деректерді талдау және шешімдерді әзірлеу кірісті
жақсартады. Бұл деректер ұйымның тиімді және нәтижелі жұмыс істеуі
үшін маңызды рөл атқаратынын көрсетеді. Деректер жылдам өсіп келе
жатқандықтан, реляциялық мәліметтер базасы немесе тұрақты сақтау
құрылғылары жеткіліксіз. Сақтау және өңдеу қиын болатын үлкен
мәліметтер жиынтығын Үлкен деректер немесе Үлкен деректер деп
атауға болады.
Үлкен мәліметтер үш қасиетке ие. Олар көлем,
жылдамдық және алуан түрлі. Біріншіден, Үлкен деректер - бұл
мәліметтердің үлкен көлемі. Бұл деректер Giga байтының, Тера
байттың көлемін алуы немесе одан да жоғары болуы мүмкін. Екінші
атрибут - жылдамдық. Бұл деректерді құру жылдамдығы. Бұл қоршаған
ортадағы өзгерістерді және әуе кемелерін анықтаудағы маңызды
қасиет. Дәл осы жағдайларда нақты және үздіксіз болуы керек. Нақты
уақыт режимінде шешім қабылдау маңызды фактор болып табылады. Тағы
бір негізгі қасиет - бұл мәліметтер типін сипаттайтын алуан
түрлілік. Деректер мәтіндік форматты, бейне, аудио, кескін, XML
форматын, сенсорлық деректерді және т.б. қабылдауы
мүмкін.
Пәндік лексика және
терминология:
Деректер қоры –
Database
Өріс – Поле –
Field
Жазба – Запись –
Record
Индекс – Индекс –
Index
Деректер қорын басқару
жүйесі (ДҚБЖ) – Система управления базой данных (СУБД) – Database
Management System (DBMS)
Алғашқы кілт – Первичный
ключ – Primary Key
Деректер типтері – Типы
данных – Data types
Кесте – Таблица –
Table
Сұрыптау – Сортировка –
Sorting
Сүзгілеу – Фильтрация –
Filtration
Форма – Форма –
Form
Басты түймелік форма –
Главная кнопочная форма – Main Menu Form Есептер – Отчеты –
Reports
Сұраныс – Запрос –
Query