Compartilhamento |
![]() ![]() |
Use este identificador para citar ou linkar para este item:
http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7799
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | FONCECA JUNIOR, José Ilberto | - |
dc.creator.Lattes | http://lattes.cnpq.br/9496477807186101 | por |
dc.contributor.advisor1 | FIGUEIRÊDO, Pedro Hugo de | - |
dc.contributor.referee1 | FIGUEIRÊDO, Pedro Hugo de | - |
dc.contributor.referee2 | SOUZA, Adauto José Ferreira de | - |
dc.contributor.referee3 | GONZÁLEZ, Ramón Enrique Ramayo | - |
dc.date.accessioned | 2018-12-21T14:12:00Z | - |
dc.date.issued | 2017-04-19 | - |
dc.identifier.citation | FONCECA JUNIOR, José Ilberto. Estudo da correlação entre propriedades estatísticas de verbetes. 2017. 118 f. Dissertação (Programa de Pós-Graduação em Física Aplicada) - Universidade Federal Rural de Pernambuco, Recife. | por |
dc.identifier.uri | http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7799 | - |
dc.description.resumo | As investigações das línguas naturais através da aplicação de métodos matemáticos e estatísticos que buscam caracterizar propriedades de textos literários têm sido objeto de intensa investigação nas últimas décadas, constituindo uma área denominada de linguística quantitativa. Os primeiros trabalhos nessa área surgiram entre as décadas de 1930 e 1950, com os trabalhos de George Zipf no estudo da distribuição de frequências e Claude Shannon com seu trabalho em previsão de letras e palavras e entropia como medida de redundância em língua inglesa. Nesta dissertação serão investigadas a autocorrelação e correlações cruzadas das séries temporais utilizando técnicas comuns ao estudo de séries temporais não-estacionárias. Discutiremos também quais propriedades emergem dessas correlações e suas implicações no processo de escrita. Ao longo dessa análise, todos os resultados foram obtidos para um conjunto de 250 textos literários escritos em 10 línguas distintas. No momento fi nal desse trabalho, analisaremos as propriedades de textos genéricos obtidos através de dois modelos de distribuições de distância: uma que leva em consideração as distâncias entre os números primos consecutivos e outra que utiliza a distribuição de Weibull. Exploraremos as características que surgem em cada um dos modelos comparando-as com seus equivalentes nos textos em linguagem natural. | por |
dc.description.abstract | The application of mathematical and statistical methods to exploit properties in natural languages has a recent and proli c history. These methods and the quantitative tecnhiques adapted and created through the study of languages are part of an area usually called quantitative linguistics. The rst work on such area was performed by George Zipf from 1930 to 1950 in which the distribution of word frequencies were studied. His works were followed by Claude Shannon's analysis on entropy and letters prediction as a measure of redundancy in written english. In this work, we firstly present a study on correlation and cross-correlation through the time series extracted from texts by using common approaches to investigate non-stationary time series. To perform the required analysis we have used a corpora as large as 250 literary texts from 10 diferent languages. The properties emerging from these correlations will also be discussed and properly explained. Secondly, we move to the description of the distance distribution responsible for the long-range structure observed on written language. We devise those distributions by assuming the distance distribution from consecutive prime numbers and distances taken from a Weibull distributed process. The revenues from such models will be put under scrutiny by using the techniques presented during the work and comparing them to properties emerging in natural language. | eng |
dc.description.provenance | Submitted by Mario BC (mario@bc.ufrpe.br) on 2018-12-21T14:12:00Z No. of bitstreams: 1 Jose Ilberto Fonseca Junior.pdf: 1959717 bytes, checksum: 54e06f9b34ec16b3e6c466b3ecc773ac (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2018-12-21T14:12:00Z (GMT). No. of bitstreams: 1 Jose Ilberto Fonseca Junior.pdf: 1959717 bytes, checksum: 54e06f9b34ec16b3e6c466b3ecc773ac (MD5) Previous issue date: 2017-04-19 | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | por |
dc.format | application/pdf | * |
dc.language | por | por |
dc.publisher | Universidade Federal Rural de Pernambuco | por |
dc.publisher.department | Departamento de Física | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFRPE | por |
dc.publisher.program | Programa de Pós-Graduação em Física Aplicada | por |
dc.rights | Acesso Aberto | por |
dc.subject | Linguística quantitativa | por |
dc.subject | Entropia | por |
dc.subject | Método estatístico | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::FISICA | por |
dc.title | Estudo da correlação entre propriedades estatísticas de verbetes | por |
dc.type | Dissertação | por |
Aparece nas coleções: | Mestrado em Física Aplicada |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Jose Ilberto Fonseca Junior.pdf | Documento principal | 1,91 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.