

Tópicos em Aprendizado Estatístico: teorias e aplicações
Workshop de pesquisa organizado pelos docentes do programa Jodavid Ferreira, Maria Ioneis Oliveira e Vinícius Scher.
Minicurso 1
Métodos estatísticos em análise espacial
12/05 e 13/05 - 14h00 a 15h00 - Auditório DE
Dra. Elisangela Ap. da Silva Lizzi - UTFPR
Curso introdutório sobre métodos estatísticos em análise espacial, com componente de treinamento técnico e implementação computacional em R. O conteúdo programático é estruturado de maneira progressiva, abrangendo desde uma introdução à visualização de mapas no R, até a análise de padrões espaciais usando modelagem. A metodologia proposta, combina aulas teóricas expositivas com sessões práticas computacionais utilizando conjuntos de dados reais, ou seja, promove uma aprendizagem efetiva e aplicável, com dois estudos de caso para cada dia de curso. O curso é direcionado a um público-alvo amplo e relevante, incluindo pesquisadores, estudantes de pós-graduação e profissionais. Os pré-requisitos, são conhecimento de estatística, aspectos gerais de epidemiologia espacial e familiaridade com o ambiente R são vantajosos, mas não obrigatórios, isso torna o curso acessível. A carga horária de 2h distribuída em dois dias facilita a participação dos interessados. Ao término do curso, os participantes estarão aptos a utilizar o R como uma ferramenta para visualização e interpretação de dados espaciais com ênfase em dados de saúde pública, fortalecendo assim as capacidades de vigilância epidemiológica e o desenvolvimento de estratégias de intervenção baseadas em evidências. Este curso promove não apenas a aquisição de conhecimento técnico, mas também o desenvolvimento de habilidades práticas essenciais para informações de saúde pública no contexto atual.
Minicurso 2
Uma introdução as máquinas de vetores de suporte e suas extensões
12/05,13/05 e 14/05 - 16h30 a 17h30 - Auditório DE
Dr. Anderson Ara - DESt | UFPR
Dentre as diversas técnicas de aprendizado estatístico, destacam-se as máquinas de vetores de suporte (SVM - Support Vector Machines). Os SVMs são um tipo de modelo de aprendizado não-paramétrico que tem como objetivo maximizar a margem entre os dados de diferentes naturezas. No problema de classificação, por exemplo, eles buscam encontrar um hiperplano que melhor separe as classes dos dados. Neste minicurso, apresentamos as principais definições dos modelos de vetores de suporte e suas extensões para métodos de regressão, regressão censurada e métodos não-supervisionados. As aplicações serão realizadas por meio da Linguagem R.
Palestras
Modeling PolSAR data by stochastic summation
12/05 - 15h00 - Auditório DE
Dr. Abraão Nascimento - UFPE
Polarimetric synthetic aperture radar (PolSAR) systems are an important tool in remote sensing. Such systems can provide images with high spatial resolution, but they are contaminated by an interference pattern, the so-called multidimensional speckle. This fact requires a special treatment of PolSAR images. In particular, tailor-made laws are sought to capture the physical origin of PolSAR. In this talk, two new matrix distributions resulting from the application of the stochastic summation approach to PolSAR will be presented. They are called Compound Truncated Poisson Complex Wishart (CTPCW) and Compound Geometric Com plex Wishart (CGCW) distributions. They offer a way to express multimodal data. Maximum likelihood (ML) estimation methods using an expectation maximization algorithm for CTPCW and CGCW parameters and MLC-based graphical fitting tools are provided. Finally, the proposals are used to describe current PolSAR images and are shown to outperform other known distributions, such as WCm, G0m, and Km.
Bagging in the Context of Clustering Three-dimensional Shapes
14/05 - 15h00 - Auditório DE
Dr. Getúlio José Amorim do Amaral - UFPE
Today there are several Three-dimensional images available in several fields such as Biology, Medicine, Zoology and others. Cluster analysis is a relevant topic to obtain homogeneous groups in this context. This talk is about the work of Nascimento, Ospina and Amorim (2024). Clustering methods known as K-means, CLARANS and Hill Climbing are used. The validation of the obtained clusters is evaluated using the Rand Index and the Fowlkes-Mallows Index. The Bagging procedure is also considered to improve the performance of the proposed methods. Real and synthetic data indicated the benefits of Bagging. Reference: Nascimento, I. R., Ospina, R. and Amorim, G. (2024) Using Bagging to improve clustering methods in the context of three-dimensional shapes, Advances in Data Analysis and Classification, https://doi.org/10.1007/s11634-024-00602-9.
Introduction to Meta-learners in Causal Inference
13/05 - 15h00 - Auditório DE
Dr. Raydonal Ospina - UFBA
Empirical scientists often aim to evaluate the causal effects of interventions, policies, and treatments, using experimental or observational data and statistical tools. With the development of machine learning for prediction tasks, there has been a significant increase in methods that allow estimating Average Treatment Effects (ATEs). However, the focus is shifting to the estimation of Conditional Average Treatment Effects (CATEs) that enable the design of personalized policies and treatments, particularly in fields such as econometrics and public health. Here we introduce meta-learners, which are predictive models for estimating CATEs. Theoretical and practical implementation aspects of causal treatment effect inference embedded within a machine learning framework will be explored.
Spatiotemporal models, using Integrated Nested Laplace Approximation (INLA): case study on violence against sexual dignity in the state of Paraná, BR.
14/05 - 14h00 - Auditório DE
Dra. Elisangela Ap. da Silva Lizzi - UTFPR
In this lecture, we present the construction and application of a spatiotemporal model using bayesian inference and obtaining estimates via Integrated Nested Laplace Approximation (INLA) for data analysis with space-time patterns. I will show the details of the models and their construction within a case study that addresses the monthly incidence of crimes against sexual dignity in the state of Paraná, Brazil, from 2012 to 2019, aggregated by Integrated Public Security Areas (AISP). We assume poisson distribution for the case counts, with spatial random effects modeled by autoregressive conditional priors (CAR) and a temporal component smoothed by linear parameters. Relative risk (RR) and standardized incidence ratio (SIR) measures were estimated, with results expressed in thematic maps and tables. In addition to modeling, we developed the WikiCrimesDS application for interactive visualization of indicators, as a FRONT-END strategy. We will discuss spatiotemporal modeling with INLA, highlighting practical advantages, specification of structured and unstructured effects, and interpretation of inferential results, focusing on the robustness and computational efficiency of the method for problems applied in social epidemiology and violence analysis.
Importante:
-
Local: Todas as atividades serão realizadas no Auditório do Departamento de Estatística do CCEN/UFPE.
-
Contato: Jodavid Ferreira (jodavid.ferreira@ufpe.br)
-
Avisos: (i) As atividades serão em português. (ii) Discentes matriculados na disciplina PGE952 - Seminários de Pós-Graduação (60h) poderão usar sua frequência nas palestras do workshop para a disciplina. Para mais informação contatar o professor da disciplina.
Apoio
