| Autor | Zanuz, Luciano; |
| Lattes do autor | http://lattes.cnpq.br/1330107714671900; |
| Orientador | Rigo, Sandro José; |
| Lattes do orientador | http://lattes.cnpq.br/3914159735707328; |
| Instituição | Universidade do Vale do Rio dos Sinos; |
| Sigla da instituição | Unisinos; |
| País da instituição | Brasil; |
| Instituto/Departamento | Escola Politécnica; |
| Idioma | pt_BR; |
| Título | Developing effective AI and law applications: a methodological proposal for developing natural language processing applications based on transformers, pre-trained models and transfer learning; |
| Resumo | CONTEXTO: A interseção entre Inteligência Artificial (IA) e Direito vem sendo explorada desde os primórdios da pesquisa em IA. Nos últimos anos, tanto instituições judiciais quanto profissionais do direito têm adotado, de forma crescente, tecnologias baseadas em IA para otimizar processos, apoiar a tomada de decisões jurídicas, automatizar tarefas repetitivas e extrair informações estruturadas de textos legais. Essas aplicações são predominantemente impulsionadas por técnicas de Processamento de Linguagem Natural (PLN), dada a natureza textual dos procedimentos jurídicos. Avanços em aprendizado profundo, especialmente nas arquiteturas baseadas em transformadores e nos modelos de linguagem pré-treinados, transformaram significativamente o desenvolvimento de sistemas de PLN e alcançaram estado-da-arte em diversas tarefas. PROBLEMA: Apesar do potencial desses avanços, ainda não existe uma metodologia unificada e específica de domínio para o desenvolvimento de aplicações de IA no campo jurídico. Essa lacuna limita a adoção eficaz de soluções baseadas em PLN em contextos legais reais. Além disso, a maioria dos recursos de ponta está disponível principalmente em inglês, o que representa uma barreira para sistemas jurídicos de língua portuguesa. SOLUÇÃO: Esta tese propõe uma metodologia estruturada para o desenvolvimento de aplicações de IA aplicadas ao Direito, fundamentada em paradigmas modernos de PLN, como transformadores, aprendizado por transferência e adaptação ao domínio. A metodologia aborda tanto os desafios técnicos quanto os específicos do domínio jurídico e inclui componentes práticos, como conjuntos de dados, modelos ajustados e ferramentas de avaliação, todos voltados ao contexto jurídico em português. MÉTODO PROPOSTO: A metodologia proposta é composta por quatro etapas principais e enfatiza a colaboração interdisciplinar entre equipes jurídicas e técnicas. Ela define um fluxo de desenvolvimento claro, desde a definição do problema até a implantação da solução, incorporando validações iterativas, a criação de conjuntos de dados em nível de aplicação e o uso de mecanismos de IA Explicável, quando apropriado. RESULTADOS: A metodologia foi validada por meio de diversos experimentos, incluindo o desenvolvimento de modelos de Reconhecimento de Entidades Nomeadas (NER) jurídicas que alcançaram novos resultados de estado da arte no conjunto de dados LeNER-Br, além de experimentos com técnicas de ajuste fino específicas de contexto e ajustes eficientes em parâmetros, visando melhorar o desempenho e a adaptabilidade dos modelos. Também foi implementada uma aplicação real para geração automatizada de relatórios de sentença, apoiada por um novo framework de avaliação que combina métricas automatizadas com avaliação humana. Este trabalho ainda oferece recursos práticos em português e fornece insights sobre a correlação entre avaliações humanas e automáticas de saídas de IA no domínio jurídico, demonstrando a viabilidade e os benefícios de uma abordagem estruturada e adaptada ao domínio para o desenvolvimento de IA aplicada ao Direito.; |
| Abstract | CONTEXT: The intersection between Artificial Intelligence (AI) and Law has been explored since the early days of AI research. In recent years, both judicial institutions and legal professionals have increasingly adopted AI technologies to streamline processes, support legal decision-making, automate repetitive tasks, and extract structured information from legal texts. These applications are predominantly powered by Natural Language Processing (NLP), given the textual nature of legal proceedings. Advances in deep learning, particularly transformer-based architectures and pre-trained language models, have significantly reshaped the development of NLP systems and achieved state-of-the-art results across many downstream tasks. PROBLEM: Despite the potential of these advances, there remains a lack of a unified, domain-specific methodology for developing AI applications in the legal field. This gap limits the effective adoption of NLP-based AI solutions in real-world legal contexts. Additionally, most cutting-edge resources are available primarily in English, creating a barrier for Portuguese-speaking legal systems. SOLUTION: This thesis proposes a structured methodology for developing AI and Law applications, grounded in modern NLP paradigms such as transformers, transfer learning, and domain adaptation. The methodology addresses both technical and domain-specific challenges and includes practical components, such as datasets, fine-tuned models, and evaluation tools, tailored to the Portuguese legal context. PROPOSED METHOD: The proposed methodology is composed of four main steps and emphasizes interdisciplinary collaboration between legal and technical teams. It defines a clear development flow, from problem definition to deployment, incorporating iterative validation, the creation of applicationlevel datasets, and the use of Explainable AI mechanisms where applicable. RESULTS: The methodology was validated through multiple experiments, including the development of Legal Named Entity Recognition (NER) models that achieved new state-of-the-art results on the LeNER-Br dataset, alongside experiments with context-specific and parameter-efficient finetuning techniques to enhance model performance and adaptability. A real-world application for AI-generated judgment reports was implemented, supported by a novel evaluation framework combining automated metrics and human assessment. This work also provides practical resources in Portuguese and insights into the correlation between human and automated evaluations of AI outputs in the legal domain, demonstrating the feasibility and benefits of a structured, domain-adapted approach to AI development in legal applications.; |
| Palavras-chave | Inteligência Artificial e Direito; Processamento de Linguagem Natural; Transformadores; Artificial Intelligence and Law; Natural Language Processing; Transformers; |
| Área(s) do conhecimento | ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação; |
| Tipo | Tese; |
| Data de defesa | 2025-06-06; |
| Agência de fomento | Nenhuma; |
| Direitos de acesso | openAccess; |
| URI | http://repositorio.jesuita.org.br/handle/UNISINOS/13869; |
| Programa | Programa de Pós-Graduação em Computação Aplicada; |