
The problem of symbolic regression is to find mathematical expressions in symbolic form, approximating the relationship between the finite set of values of the independent variables and the corresponding values of the dependent variables. The criterion of quality approach (objective function) is the mean square error: the sum of the squares of the difference between the model and the values of the dependent variable for all values of the independent variable as an argument. Symbolic regression method of constructing regression models by trying different superpositions of arbitrary functions from a given set. The paper is offered hybrid algorithm for solving symbolic regression. Use the traditional idea of an algebraic formula in the form of syntax tree. Leaf nodes correspond to variables or numeric constants rather than leaf nodes contain the operation that is performed on the child nodes. A distinctive feature of the process tree representation as a linear recording is preclude loss plurality of terminal elements, but the model can be an arbitrary function of the superposition of a set. In the process of synthesis of algebraic formula two problems are solved. The first task is to build a tree structure with anonymous tips. The second task is to specify the values of the tree tops. Leaf nodes are compared with the terminal set, a non-leaf nodes are matched with a functional set. The first problem is solved by ant colony. To solve the second problem is used a genetic algorithm. The rating formula is calculated after solving both problems the construction of an ant tree unnamed peak and subsequent identification of vertices using ant colony The structure of the graph to find solutions G = (X, U). It is possible to create a solution space in which organized the search process based on the simulation of adaptive behavior of an ant colony. Formulated the necessary conditions under which the built in G route is represented as a legitimate expression D, is a solution of a symbolic regression. Developed heuristic of ant behavior when ant moving in graph to find solutions. For large dimension of time parameters of the algorithm outperformed compared algorithms for the best value of the objective function. Experimental time complexity of the algorithm on a single iteration for fixed values of the control parameters is O (nlgn), where n the power terminal set.
Рассматривается задача символьной регрессии, заключающаяся в нахождении математического выражения в символьной форме, аппроксимирующего зависимость между конечным набором значений независимых переменных и соответствующими значениями зависимых переменных. Критерием качества приближения (целевой функции) является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Символьная регрессия метод построения регрессионных моделей путем перебора различных произвольных суперпозиций функций из некоторого заданного набора. Предлагается гибридный алгоритм для решения задачи символьной регрессии. Используется традиционное представление алгебраической формулы в виде синтаксического дерева. Листовые узлы соответствуют переменным или числовым константам, а не листовые узлы содержат операцию, которая выполняется над дочерними узлами. В процессе синтеза алгебраической формулы решаются две задачи. Первая задача заключается в построении структуры дерева с безымянными вершинами. Вторая задача заключается в конкретизации значений вершин дерева. Листовые узлы сопоставляются с терминальным множеством, а нелистовые узлы сопоставляются с функциональным множеством. Первая задача решается методами муравьиной колонии. Для решения второй задачи используется генетический алгоритм. Оценка формулы вычисляется после решения обеих задач построения муравьем дерева с безымянными вершинами и последующей идентификацией вершин с помощью генетического алгоритма Разработана структура графа поиска решений G=(X,U). При больших размерностях временные показатели разработанного алгоритма превосходят показатели сравниваемых алгоритмов при лучших значениях целевой функции. Экспериментальная временная сложность алгоритма на одной итерации при фиксированных значениях управляющих параметров составляет O(nlgn), где n мощность терминального множества.
СИМВОЛЬНАЯ РЕГРЕССИЯ,СИНТАКСИЧЕСКОЕ ДЕРЕВО,ТЕРМИНАЛЬНОЕ МНОЖЕСТВО,ФУНКЦИОНАЛЬНОЕ МНОЖЕСТВО,МУРАВЬИНАЯ КОЛОНИЯ,ГЕНЕТИЧЕСКИЙ ПОИСК,ГИБРИДНЫЙ АЛГОРИТМ,SYMBOLIC REGRESSION,SYNTAX TREE,TERMINAL SET,FUNCTIONAL SET,ANT COLONY,GENETIC SEARCH,HYBRID ALGORITHM
СИМВОЛЬНАЯ РЕГРЕССИЯ,СИНТАКСИЧЕСКОЕ ДЕРЕВО,ТЕРМИНАЛЬНОЕ МНОЖЕСТВО,ФУНКЦИОНАЛЬНОЕ МНОЖЕСТВО,МУРАВЬИНАЯ КОЛОНИЯ,ГЕНЕТИЧЕСКИЙ ПОИСК,ГИБРИДНЫЙ АЛГОРИТМ,SYMBOLIC REGRESSION,SYNTAX TREE,TERMINAL SET,FUNCTIONAL SET,ANT COLONY,GENETIC SEARCH,HYBRID ALGORITHM
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
