최근 기계 학습과 같이 많은 양의 데이터를 사용하거나 분석하는 시스템 및 솔루션이 개발되고 있다. 이러한 경향에 힘입어 데이터를 분석하기 위한 알고리즘의 개발이나 새로운 유형의 모델 개발에 박차를 가하고 있다. 그러나, 수집된 데이터에 문제가 있어 이를 이용하여 데이터 세트 및 레이블을 생성하여 기계 학습을 진행하게 되면 사용자가 원하는 결과를 얻지 못할 뿐만 아니라 전혀 다른 결과를 출력하여 보여주게 된다. 최근의 기계 학습 연구에서는 데이터의 품질 및 완전성을 고려하기 위해 요구 공학 관점에서 데이터에 대한 비기능적 요구사항 도출이 제안되고 있다.
요구 공학자들은 기계 학습에서의 데이터 요구사항을 정의하고 목록화하였다. 이는 기계 학습 전체 분야에 해당하는 요구사항들을 정의한 것으로 개별 도메인이나 이미 사용되고 있는 시스템을 대상으로 하지 않는다. 또한 데이터 전처리 이전 과정을 강조하지만 구체적 요구사항은 언급하고 있지 않다. 본 연구에서는 데이터 전처리 이전에 데이터를 수집하고 저장하는 데이터 수집(DAQ) 단계에서 데이터 요구사항을 도출하였다. 이를 통해 기존 DAQ 시스템에서 필요로 하는 모든 데이터 요구사항과 이를 만족시키는 태스크(기능)의 유무, 그리고 요구사항과 기능 간의 관계를 표현할 수 있다. 결과적으로 요구 공학적 기법을 이용하여 보다 완전한 데이터 수집을 위해 필요로 하는 모든 요구사항을 추출할 수 있게 되어 DAQ 시스템의 데이터 수집 효율이 상승하게 된다. 또한 추출된 요구사항을 체계적으로 표현하고, 그 관계를 정의할 수 있어 소프트웨어 설계 문서의 작성이 가능하고 소프트웨어 설계 및 유지 보수 측면에서 체계적인 접근 및 방향성을 설정할 수 있다.
본 연구 방법은 기존 DAQ 시스템에 요구 공학적 기법 중 하나로서, 목표 모델링(Goal Modeling) 기법을 적용하여 요구 공학을 이용한 DAQ 시스템 모델을 보여준다. 기존 DAQ 시스템 사례를 이용하여 요구 공학적 접근을 위한 시나리오와 유스 케이스를 작성하고, 이를 기반으로 사례별 데이터 요구사항을 추출하고 목표 모델링을 통해 요구사항, 기능, 목표 간의 관계를 도식화한다.
연구 결과를 통해 요구 공학을 이용한 DAQ 시스템에서 시스템이 필요로 하는 비기능적 요구사항, 특히 데이터의 요구사항을 추출할 수 있었다. 기존의 DAQ 시스템에서는 특정 기능과 이를 수행하기 위한 기능적 요구사항만을 다루고 있는데, 제안 모델을 통해 데이터의 요구사항을 포함하여 대부분의 기능적/비기능적 요구사항을 추출하여 이를 설계 문서에 명세할 수 있다. 또한 제안 연구 방법은 소프트 골 기반으로 목표 모델링을 진행하였으며, 이를 요구 공학 프레임워크로 확장하여 하드 골 모델링과 조직적 구조 모델링을 병용하여 이해 관계자들의 다양하고 구체적인 요구사항을 도출하고 검증하여 DAQ 시스템 설계에 필요한 요구사항을 더 체계적으로 정의할 수 있다.
Alternative Abstract
Recently, systems and solutions have been developed that use or analyze large amounts of data, such as machine learning. With this trend, numerous researchers are accelerating the development of algorithms to analyze data or the development of new types of models. However, if there is a problem with the collected data and machine learning is performed by generating a data set and a label using this, not only does the user want a desired result, but also a completely different result is displayed. In recent machine learning studies, it is proposed to derive non-functional requirements for data from the viewpoint of requirements engineering in order to consider the quality and completeness of the data.
Requirements engineers have defined and made the list of the data requirements in machine learning. It defines requirements for the whole field of machine learning, not individual domains or systems already in use. It also emphasizes the process before data pre-processing but does not address specific requirements. In this study, data requirements were derived at the data acquisition (DAQ) stage, where data is collected and stored before data preprocessing. Through this, it is possible to express the requirements of all data required in the existing DAQ system, the presence of tasks (functions) satisfying them, and the relationship between the requirements and functions. As a result, it is possible to extract all the requirements required for more complete data collection using the requirements engineering technique, which increases the data collection efficiency of the DAQ system. In addition, it is possible to elicit requirements and to define the relationship, so that a software design document can be produced, and a systematic approach and direction can be established in terms of software design and maintenance.
This research method is one of the required engineering techniques for the existing DAQ system and shows the DAQ system model using required engineering by applying the goal modeling technique. Using existing DAQ system cases, scenarios and use cases for requirements engineering approach are created, and data requirements for each case are extracted based on them, and the relationship between requirements, functions, and goals is illustrated through goal modeling.
Through the research results, it was possible to extract the non-functional requirements of the system, especially the data requirements, from the DAQ system using requirements engineering. Existing DAQ systems only deal with specific functions and functional requirements for performing them. Most of the functional/non-functional requirements, including data requirements, can be extracted from the proposed research method and specified in a design document. In addition, target modeling was conducted based on soft-goal modeling on the proposed model, and this could be extended to requirement engineering framework to combine and analyze within hard-goal modeling and organizational structure modeling to derive and verify various specific requirements from stakeholders to verify the DAQ system design. Requirements can be defined more systematically.