Author(s):
Paiva, Rui Pedro Pinto de Carvalho e
Date: 1999
Persistent ID: http://hdl.handle.net/10316/15368
Origin: Estudo Geral - Universidade de Coimbra
Subject(s): Identificação de sistemas dinâmicos; Lógica difusa; Sistemas difusos; Modelização difusa; Redes neuronais; Identification of dynamical systems; Fuzzy logic; Fuzzy systems; Fuzzy modeling; Neural networks
Description
No momento presente da História, é lícito afirmar-se que a humanidade se encontra em plena
era da informação. De facto, em qualquer aspecto da sociedade, desde as actividades de lazer até
aos mais complexos sistemas de produção, é notória a presença e influência das tecnologias de
informação. Assim, assiste-se presentemente a um forte impulso na investigação, desenvolvimento
e aplicação de metodologias de computação aos processos industriais de produção. Na verdade, o
elevado grau de complexidade que os caracteriza, acompanhado de uma necessidade crescente de
desempenho como forma de dar resposta às leis de mercado, exige a utilização de estratégias cada
vez mais sofisticadas. Uma das áreas que tem merecido uma atenção particular tem sido a soft
computing, a qual engloba metodologias tais como a lógica difusa, redes neuronais e algoritmos
genéticos, de forma simples ou combinada, constituindo um dos pilares dos sistemas de informação
inteligentes. Neste contexto, a dissertação apresentada pretende contribuir para a compreensão do
potencial associado às técnicas neuro-difusas como mecanismo de identificação de sistemas.
Assim, numa primeira fase introdutória, são apresentados e discutidos os princípios básicos
da lógica difusa, sistemas difusos e redes neuronais, enquadrados na temática da identificação de
sistemas.
Neste trabalho, são estudadas diversas estruturas difusas, nomeadamente os sistemas de
Takagi-Sugeno de ordem 0 e 1, bem como sistemas linguísticos. Neste sentido, são abordados dois
aspectos essenciais da identificação difusa: a aprendizagem da estrutura e a aprendizagem de
parâmetros. No primeiro ponto é prestada especial atenção à utilização de técnicas de agrupamento
de classes, destacando-se, de entre estas, o algoritmo de agrupamento subtractivo. Ainda em
relação à aprendizagem da estrutura, é abordada a questão da selecção de entradas relevantes.
Relativamente à aprendizagem de parâmetros, a mesma é conduzida com recurso ao treino de uma
rede neuronal difusa pelo algoritmo de retropropagação do erro, sendo, em algumas situações,
utilizados esquemas híbridos baseados em optimização linear e não linear. Ainda em relação a este
ponto, o problema da aprendizagem incremental de parâmetros é abordado, ainda que de forma
superficial.
Um aspecto relevante no contexto da implementação de modelos difusos prende-se com a
exploração do potencial que lhes é inerente em termos de transparência do modelo final. Assim
sendo, são apresentados alguns estudos originais em termos de estratégias que visem a manutenção
da interpretabilidade dos modelos durante a aprendizagem de parâmetros, as quais se baseiam em
medidas de similaridade e na aprendizagem restringida de parâmetros.
As metodologias referidas foram aplicadas a alguns casos de estudo, e.g., a série caótica
Mackey-Glass e a fornalha de Gás Box-Jenkins, os quais confirmaram as suas capacidades de
modelização, assim com a adequação das técnicas difusas na implementação de modelos
interpretáveis. As mesmas técnicas foram aplicadas a um sistema industrial, nomeadamente uma
planta de branqueamento de pasta da papel. Contudo, os resultados obtidos não foram totalmente
satisfatórios, em virtude da deficiente qualidade dos dados de identificação. Na realização do estudo efectuado, os algoritmos descritos neste trabalho foram
implementados na linguagem de programação C++, preparando-se neste momento a sua integração
numa interface gráfica por forma a que a ferramenta computacional desenvolvida possa constituir
um auxílio no estudo dos problemas analisados nesta dissertação, tanto com funções didácticas
como de investigação científica. Nowadays, humankind is in the era of information. In fact, in most of the aspects of today’s
society, from leisure activities to complex production systems, the presence and influence of the
technologies of information is clear. Thus, there is presently a strong impulse towards the research,
development and application of computing methodologies in industrial production systems.
Actually, the high degree of complexity that characterizes those systems, as well as the increasing
necessities in terms of performance in order to cope with the rules of the market, demands
strategies more and more sophisticated. One of the areas that has deserved a particular attention is
soft computing, which includes techniques like fuzzy logic, neural networks and genetic
algorithms, in a simple or combined fashion, and constitutes itself as the basis for intelligent
information systems. In this context, the study carried out aims to contribute to the comprehension
of the potential associated to neuro-fuzzy techniques as a mechanism for system identification.
In a first introductory phase, the grounds of fuzzy logic, fuzzy systems and neural networks
are presented and discussed, integrated in the problem of system identification.
In this work, several fuzzy structures are analyzed, namely Takagi-Sugeno (zero and first
order) systems and linguistic systems. Two major concerns of fuzzy identification are studied:
structure learning and parameter learning. Referring to the first item, clustering techniques receive
a deeper attention, especially subtractive clustering. Still in the same point, the questions related to
relevant input selection are addressed. As for parameter learning, this task is carried out after the
determination of a structure, based on the training of a fuzzy neural network via error
backpropagation. In some situations, hybrid learning schemes are also utilized, which result from
the combination of both linear and nonlinear optimization algorithms. In the point of parameter
learning, the problem of online learning is also addressed, though superficially.
A relevant matter in the context of fuzzy identification relates to the use of their potential in
terms of model transparency. In this way, some original studies are performed, regarding the
construction of interpretable fuzzy models, which are based on similarity measures and restricted
parameter learning.
The subjects mentioned above were applied to same case studies, e.g., the Mackey-Glass
chaotic time series and the Box-Jenkins gas furnace, which confirmed their modeling capabilities,
as well as the adequacy of fuzzy techniques for the building up of interpretable models. The same
techniques were applied to an industrial plant, namely a pulp bleaching plant. However, the results
obtained so far are not totally satisfactory, due to bad data quality, which resulted from a deficient
sampling time, as well as insufficient excitation of some input variables.
The techniques studied are implemented in software, and constitute the core of an
application, which is being developed to assist the comprehension and analysis of the main issues
regarding fuzzy identification. The resulting software tool will be used both with research and
pedagogical goals. Dissertação de mestrado apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra