Wednesday 2 August 2017

Filtro Médio Móvel Eficiente


Recentemente, aprendi sobre avanços na resposta a esta publicação. E estava me perguntando como eu poderia usá-los para calcular um filtro médio móvel de forma mais eficiente do que o que eu propus nesta publicação (usando filtros de convolução). É o que eu tenho até agora. Ele leva uma visão da matriz original, em seguida, rola pela quantidade necessária e resume os valores do kernel para calcular a média. Estou ciente de que as bordas não são tratadas corretamente, mas posso cuidar disso depois. Existe uma maneira melhor e mais rápida O objetivo é filtrar grandes arrays de ponto flutuante até 5000x5000 x 16 camadas de tamanho, uma tarefa que scipy. ndimage. filters. convolve é bastante lenta em. Observe que estou procurando uma conectividade de 8 vizinhos, ou seja, um filtro 3x3 leva a média de 9 pixels (8 em torno do pixel focal) e atribui esse valor ao pixel na nova imagem. EDITAR esclarecimentos sobre como vejo isso funcionando: use stridetricks para gerar uma matriz como 0,1,2,1,2,3,2,3,4. O que corresponde à linha superior do kernel de filtro. Rolar ao longo do eixo vertical para obter a linha do meio do grão 10,11,12,11,12,13,13,14,15. E adicione-o à matriz que recebi em 1) Repita para obter a linha inferior do kernel 20,21,22,21,22,23,22,23,24. . Neste ponto, eu tomo a soma de cada linha e dividi-la pelo número de elementos no filtro, me dando a média para cada pixel, (deslocado por 1 linha e 1 col, e com algumas curiosidades em torno de bordas, mas eu posso Cuide disso mais tarde). O que eu esperava era um melhor uso de stridetricks para obter os 9 valores ou a soma dos elementos do kernel diretamente, para toda a matriz, ou que alguém possa me convencer de outro método mais eficiente. Perguntou 8 de fevereiro às 18:05 Para o que vale a pena, como você o faria usando truques extravagantes. Eu ia publicar isso ontem, mas me distraí com o trabalho real. ) Paul amp comer ambos têm boas implementações usando várias outras maneiras de fazer isso. Apenas para continuar com as coisas da pergunta anterior, imaginei que eu escreva o equivalente N-dimensional. Você não conseguirá bater significativamente as funções scipy. ndimage para matrizes 1D, no entanto. (Scipy. ndimage. uniformfilter deve vencer scipy. ndimage. convolve.) Além disso, se você estiver tentando obter uma janela em movimento multidimensional, você arrisca que o uso de memória explodisse sempre que você inadvertidamente faça uma cópia da sua matriz. Enquanto a matriz de rolamento inicial é apenas uma visão da memória de sua matriz original, quaisquer etapas intermediárias que copiem a matriz fará uma cópia que é uma ordem de grandeza maior que sua matriz original (ou seja, digamos que você está trabalhando com uma matriz original de 100x100 . A visão nele (para um tamanho de filtro de (3,3)) será 98x98x3x3, mas usará a mesma memória que o original. No entanto, qualquer cópia usará a quantidade de memória que uma matriz completa 98x98x3x3 seria) Basicamente, usando louco Truques de estrondo é ótimo para quando você deseja vetualizar operações de janela em movimento em um único eixo de um ndarray. Isso facilita o cálculo de coisas como um desvio padrão móvel, etc, com uma pequena sobrecarga. Quando você quer começar a fazer isso ao longo de múltiplos eixos, é possível, mas você geralmente está melhor com funções mais especializadas. (Por exemplo, scipy. ndimage, etc.) De qualquer forma, como você faz isso: o que obtemos quando fazemos b rollingwindow (a, filtsize) é uma matriz 8x8x3x3, isso é realmente uma visão da mesma memória que o original 10x10 Matriz. Poderíamos ter tão facilmente usado o tamanho de filtro diferente ao longo de diferentes eixos ou operados somente ao longo dos eixos selecionados de uma matriz N-dimensional (ou seja, filtsize (0,3,0,3) em uma matriz 4-dimensional nos daria uma visão de 6 dimensões ). Podemos então aplicar uma função arbitrária ao último eixo repetidamente para efetivamente calcular as coisas em uma janela em movimento. No entanto, porque estavam armazenando arrays temporários que são muito maiores do que a nossa matriz original em cada passo da média (ou std ou o que quer que seja), isso não é eficiente de memória. Também não será terrivelmente rápido. O equivalente para ndimage é apenas: isso irá lidar com uma variedade de condições de contorno, faça a desfocagem no local sem requerer uma cópia temporária da matriz e seja muito rápido. Trucos ambulantes são uma boa maneira de aplicar uma função a uma janela em movimento ao longo de um eixo, mas eles não são uma boa maneira de fazê-lo ao longo de múltiplos eixos, geralmente. Apenas meu 0.02, pelo menos. Muito bem colocado: os truques de andar são uma boa maneira de aplicar uma função a uma janela em movimento ao longo de um eixo, mas eles não são uma boa maneira de fazê-lo ao longo de múltiplos eixos, geralmente. E é claro que sua explicação sobre a memória 39 é importante. Tipo de resumo da sua resposta (pelo menos para mim) é: 39don39t ir muito longe pescando, a captura quarenteed é allready em scipy39. Obrigado ndash coma 9 de fevereiro às 16:37 Obrigado, Joe, por esta resposta. Em rollingwindow deve o ifat hasattr (.): Retornar rollingwindowlastaxis (.) Em vez de rollingwindow. Ndash unutbu 12 de fevereiro às 16:47 Não estou familiarizado com o Python para escrever código para isso, mas as duas melhores maneiras de acelerar as convoluções são separar o filtro ou usar a transformada de Fourier. Filtro separado. A convolução é O (MN), onde M e N são o número de pixels na imagem e o filtro, respectivamente. Uma vez que a filtragem média com um núcleo de 3 por 3 é equivalente a filtrar primeiro com um kernel de 3 por 1 e, em seguida, um kernel de 1 por 3, você pode obter uma melhoria de 33 (33) 30 velocidades por convolução consecutiva com Dois kernels 1-d (obviamente isso fica melhor à medida que o núcleo aumenta). Você ainda pode usar truques de passo aqui, é claro. Transformada de Fourier . Conv (A, B) é equivalente a ifft (fft (A) fft (B)). Isto é, uma convolução no espaço direto se torna uma multiplicação no espaço de Fourier, onde A é sua imagem e B é seu filtro. Uma vez que a multiplicação (dos elementos) das transformações de Fourier requer que A e B sejam do mesmo tamanho, B é uma matriz de tamanho (A) com o kernel no centro da imagem e zeros em qualquer outro lugar. Para colocar um kernel 3-por-3 no centro de uma matriz, você pode ter que atacar A para o tamanho ímpar. Dependendo da sua implementação da transformada de Fourier, isso pode ser muito mais rápido do que a convolução (e se você aplicar o mesmo filtro várias vezes, você pode pré-calcular fft (B). Salvar outros 30 de tempo de computação). Respondeu 9 de fevereiro às 15:27 Para o que vale a pena, em python, estas são implementadas em scipy. ndimage. uniformfilter e scipy. signal. fftconvolve. respectivamente. Ndash Joe Kington 9 de fevereiro às 15:44 Jonas: Cool A abordagem do filtro separado funciona bem, como você diz, economiza mais tempo à medida que o tamanho do kernel aumenta. Para uma matriz de 5000x5000, com um tamanho de kernel 11x11, eu estou obtendo 7,7s para 2 dias de convolução usando ndimage. convolve e 2.0s para duas convulsões 1d usando ndimage. convolve1d. Para a sua segunda solução, o que é B ndash Benjamin 9 de fevereiro às 16:02 Uma coisa que eu tenho certeza precisa ser corrigida é a sua matriz de visão b. Tem alguns itens da memória não alocada, para que você fique com falhas. Dada a sua nova descrição do seu algoritmo, a primeira coisa que precisa ser corrigida é o fato de que você está caminhando para fora da alocação de um: Porque ainda não estou entendendo o método e parece haver maneiras mais simples de resolver o problema. Para colocar isso aqui: o que parece ser a abordagem direta. A única operação estranha é que ele aloca e povoa B apenas uma vez. Toda a adição, divisão e indexação deve ser feita independentemente. Se você está fazendo 16 bandas, você ainda precisa alocar B uma vez se sua intenção for salvar uma imagem. Mesmo que isso não seja útil, pode esclarecer por que não entendo o problema, ou pelo menos servir como referência para acelerar os outros métodos. Isso é executado em 2.6 seg no meu laptop em uma série de 5k x 5k de float64s, 0.5 da qual é a criação de B respondida em 8 de fevereiro às 19:31. Não é tão clara sua pergunta, mas suponho agora que você gostaria de melhorar Significativamente esse tipo de média. Agora, que tipo de melhorias de desempenho você realmente esperaria Atualização: Antes de tudo, um aviso: o código em seu estado atual não se adapta adequadamente à forma do kernel. No entanto, essa não é minha principal preocupação agora (de qualquer forma, a idéia é como se adaptar corretamente). Acabei de escolher a nova forma de um 4D A de forma intuitiva, para mim, realmente faz sentido pensar em um centro de núcleo 2D a ser centrado em cada posição de grade do original 2D A. Mas essa modelagem 4D pode não ser realmente a melhor. Acho que o problema real aqui é o desempenho da soma. Um deve ser capaz de encontrar a melhor ordem (do 4D A) para utilizar completamente a arquitetura do seu cache de máquinas. No entanto, essa ordem pode não ser a mesma para pequenos arrays que tipo de coopera com o cache de suas máquinas e aqueles maiores, que não são (pelo menos não tão direto). Atualização 2: Aqui está uma versão ligeiramente modificada do mf. Claramente, é melhor remodelar para uma matriz 3D primeiro e depois em vez de somar apenas o produto ponto (isso tem a vantagem de tudo, então esse kernel pode ser arbitrário). No entanto, ainda é um pouco mais lento (na minha máquina) do que a função atualizada Pauls. Respondeu 8 de fevereiro às 19: 33 Recentemente aprendi sobre avanços na resposta a esta postagem. E estava me perguntando como eu poderia usá-los para calcular um filtro médio móvel de forma mais eficiente do que o que eu propus nesta publicação (usando filtros de convolução). É o que eu tenho até agora. Ele leva uma visão da matriz original, em seguida, rola pela quantidade necessária e resume os valores do kernel para calcular a média. Estou ciente de que as bordas não são tratadas corretamente, mas posso cuidar disso depois. Existe uma maneira melhor e mais rápida O objetivo é filtrar grandes arrays de ponto flutuante até 5000x5000 x 16 camadas de tamanho, uma tarefa que scipy. ndimage. filters. convolve é bastante lenta em. Observe que estou procurando uma conectividade de 8 vizinhos, ou seja, um filtro 3x3 leva a média de 9 pixels (8 em torno do pixel focal) e atribui esse valor ao pixel na nova imagem. EDITAR esclarecimentos sobre como vejo isso funcionando: use stridetricks para gerar uma matriz como 0,1,2,1,2,3,2,3,4. O que corresponde à linha superior do kernel de filtro. Rolar ao longo do eixo vertical para obter a linha do meio do grão 10,11,12,11,12,13,13,14,15. E adicione-o à matriz que recebi em 1) Repita para obter a linha inferior do kernel 20,21,22,21,22,23,22,23,24. . Neste ponto, eu tomo a soma de cada linha e dividi-la pelo número de elementos no filtro, me dando a média para cada pixel, (deslocado por 1 linha e 1 col, e com algumas curiosidades em torno de bordas, mas eu posso Cuide disso mais tarde). O que eu esperava era um melhor uso de stridetricks para obter os 9 valores ou a soma dos elementos do kernel diretamente, para toda a matriz, ou que alguém possa me convencer de outro método mais eficiente. Perguntou 8 de fevereiro às 18:05 Para o que vale a pena, como você o faria usando truques extravagantes. Eu ia publicar isso ontem, mas me distraí com o trabalho real. ) Paul amp comer ambos têm boas implementações usando várias outras maneiras de fazer isso. Apenas para continuar com as coisas da pergunta anterior, imaginei que eu escreva o equivalente N-dimensional. Você não conseguirá bater significativamente as funções scipy. ndimage para matrizes 1D, no entanto. (Scipy. ndimage. uniformfilter deve vencer scipy. ndimage. convolve.) Além disso, se você estiver tentando obter uma janela em movimento multidimensional, você arrisca que o uso de memória explodisse sempre que você inadvertidamente faça uma cópia da sua matriz. Enquanto a matriz de rolamento inicial é apenas uma visão da memória de sua matriz original, quaisquer etapas intermediárias que copiem a matriz fará uma cópia que é uma ordem de grandeza maior que sua matriz original (ou seja, digamos que você está trabalhando com uma matriz original de 100x100 . A visão nele (para um tamanho de filtro de (3,3)) será 98x98x3x3, mas usará a mesma memória que o original. No entanto, qualquer cópia usará a quantidade de memória que uma matriz completa 98x98x3x3 seria) Basicamente, usando louco Truques de estrondo é ótimo para quando você deseja vetualizar operações de janela em movimento em um único eixo de um ndarray. Isso facilita o cálculo de coisas como um desvio padrão móvel, etc, com uma pequena sobrecarga. Quando você quer começar a fazer isso ao longo de múltiplos eixos, é possível, mas você geralmente está melhor com funções mais especializadas. (Por exemplo, scipy. ndimage, etc.) De qualquer forma, como você faz isso: o que obtemos quando fazemos b rollingwindow (a, filtsize) é uma matriz 8x8x3x3, isso é realmente uma visão da mesma memória que o original 10x10 Matriz. Poderíamos ter tão facilmente usado o tamanho de filtro diferente ao longo de diferentes eixos ou operados somente ao longo dos eixos selecionados de uma matriz N-dimensional (ou seja, filtsize (0,3,0,3) em uma matriz 4-dimensional nos daria uma visão de 6 dimensões ). Podemos então aplicar uma função arbitrária ao último eixo repetidamente para efetivamente calcular as coisas em uma janela em movimento. No entanto, porque estavam armazenando arrays temporários que são muito maiores do que a nossa matriz original em cada passo da média (ou std ou o que quer que seja), isso não é eficiente de memória. Também não será terrivelmente rápido. O equivalente para ndimage é apenas: isso irá lidar com uma variedade de condições de contorno, faça a desfocagem no local sem requerer uma cópia temporária da matriz e seja muito rápido. Trucos ambulantes são uma boa maneira de aplicar uma função a uma janela em movimento ao longo de um eixo, mas eles não são uma boa maneira de fazê-lo ao longo de múltiplos eixos, geralmente. Apenas meu 0.02, pelo menos. Muito bem colocado: os truques de andar são uma boa maneira de aplicar uma função a uma janela em movimento ao longo de um eixo, mas eles não são uma boa maneira de fazê-lo ao longo de múltiplos eixos, geralmente. E é claro que sua explicação sobre a memória 39 é importante. Tipo de resumo da sua resposta (pelo menos para mim) é: 39don39t ir muito longe pescando, a captura quarenteed é allready em scipy39. Obrigado ndash coma 9 de fevereiro às 16:37 Obrigado, Joe, por esta resposta. Em rollingwindow deve o ifat hasattr (.): Retornar rollingwindowlastaxis (.) Em vez de rollingwindow. Ndash unutbu 12 de fevereiro às 16:47 Não estou familiarizado com o Python para escrever código para isso, mas as duas melhores maneiras de acelerar as convoluções são separar o filtro ou usar a transformada de Fourier. Filtro separado. A convolução é O (MN), onde M e N são o número de pixels na imagem e o filtro, respectivamente. Uma vez que a filtragem média com um núcleo de 3 por 3 é equivalente a filtrar primeiro com um kernel de 3 por 1 e, em seguida, um kernel de 1 por 3, você pode obter uma melhoria de 33 (33) 30 velocidades por convolução consecutiva com Dois kernels 1-d (obviamente isso fica melhor à medida que o núcleo aumenta). Você ainda pode usar truques de passo aqui, é claro. Transformada de Fourier . Conv (A, B) é equivalente a ifft (fft (A) fft (B)). Isto é, uma convolução no espaço direto se torna uma multiplicação no espaço de Fourier, onde A é sua imagem e B é seu filtro. Uma vez que a multiplicação (dos elementos) das transformações de Fourier requer que A e B sejam do mesmo tamanho, B é uma matriz de tamanho (A) com o kernel no centro da imagem e zeros em qualquer outro lugar. Para colocar um kernel 3-por-3 no centro de uma matriz, você pode ter que atacar A para o tamanho ímpar. Dependendo da sua implementação da transformada de Fourier, isso pode ser muito mais rápido do que a convolução (e se você aplicar o mesmo filtro várias vezes, você pode pré-calcular fft (B). Salvar outros 30 de tempo de computação). Respondeu 9 de fevereiro às 15:27 Para o que vale a pena, em python, estas são implementadas em scipy. ndimage. uniformfilter e scipy. signal. fftconvolve. respectivamente. Ndash Joe Kington 9 de fevereiro às 15:44 Jonas: Cool A abordagem do filtro separado funciona bem, como você diz, economiza mais tempo à medida que o tamanho do kernel aumenta. Para uma matriz de 5000x5000, com um tamanho de kernel 11x11, eu estou obtendo 7,7s para 2 dias de convolução usando ndimage. convolve e 2.0s para duas convulsões 1d usando ndimage. convolve1d. Para a sua segunda solução, o que é B ndash Benjamin 9 de fevereiro às 16:02 Uma coisa que eu tenho certeza precisa ser corrigida é a sua matriz de visão b. Tem alguns itens da memória não alocada, para que você fique com falhas. Dada a sua nova descrição do seu algoritmo, a primeira coisa que precisa ser corrigida é o fato de que você está caminhando para fora da alocação de um: Porque ainda não estou entendendo o método e parece haver maneiras mais simples de resolver o problema. Para colocar isso aqui: o que parece ser a abordagem direta. A única operação estranha é que ele aloca e povoa B apenas uma vez. Toda a adição, divisão e indexação deve ser feita independentemente. Se você está fazendo 16 bandas, você ainda precisa alocar B uma vez se sua intenção for salvar uma imagem. Mesmo que isso não seja útil, pode esclarecer por que não entendo o problema, ou pelo menos servir como referência para acelerar os outros métodos. Isso é executado em 2.6 seg no meu laptop em uma série de 5k x 5k de float64s, 0.5 da qual é a criação de B respondida em 8 de fevereiro às 19:31. Não é tão clara sua pergunta, mas suponho agora que você gostaria de melhorar Significativamente esse tipo de média. Agora, que tipo de melhorias de desempenho você realmente esperaria Atualização: Antes de tudo, um aviso: o código em seu estado atual não se adapta adequadamente à forma do kernel. No entanto, essa não é minha principal preocupação agora (de qualquer forma, a idéia é como se adaptar corretamente). Acabei de escolher a nova forma de um 4D A de forma intuitiva, para mim, realmente faz sentido pensar em um centro de núcleo 2D a ser centrado em cada posição de grade do original 2D A. Mas essa modelagem 4D pode não ser realmente a melhor. Acho que o problema real aqui é o desempenho da soma. Um deve ser capaz de encontrar a melhor ordem (do 4D A) para utilizar completamente a arquitetura do seu cache de máquinas. No entanto, essa ordem pode não ser a mesma para pequenos arrays que tipo de coopera com o cache de suas máquinas e aqueles maiores, que não são (pelo menos não tão direto). Atualização 2: Aqui está uma versão ligeiramente modificada do mf. Claramente, é melhor remodelar para uma matriz 3D primeiro e depois em vez de somar apenas o produto ponto (isso tem a vantagem de tudo, então esse kernel pode ser arbitrário). No entanto, ainda é um pouco mais lento (na minha máquina) do que a função atualizada Pauls. Respondeu em 8 de fevereiro às 19: 33Como outros já mencionaram, você deve considerar um filtro IIR (resposta de impulso infinito) em vez do filtro FIR (filtro de resposta finito) que você está usando agora. Há mais, mas à primeira vista os filtros FIR são implementados como convoluções explícitas e filtros IIR com equações. O filtro IIR particular que eu uso muito em microcontroladores é um filtro passa-baixa de um único pólo. Este é o equivalente digital de um simples filtro analógico R-C. Para a maioria dos aplicativos, estes terão melhores características do que o filtro de caixa que você está usando. A maioria dos usos de um filtro de caixa que eu encontrei são resultado de alguém que não presta atenção na classe de processamento de sinal digital, não como resultado de precisar de suas características particulares. Se você quiser apenas atenuar as altas freqüências que você conhece são ruim, um filtro passa-baixa de um único pólo é melhor. A melhor maneira de implementar um digitalmente em um microcontrolador é geralmente: FILT lt-- FILT FF (NEW-FILT) FILT é um pedaço de estado persistente. Esta é a única variável persistente que você precisa para calcular este filtro. NOVO é o novo valor que o filtro está sendo atualizado com esta iteração. FF é a fração do filtro. Que ajusta o peso do filtro. Olhe para este algoritmo e veja que para FF 0 o filtro é infinitamente pesado, já que a saída nunca muda. Para FF 1, realmente não há nenhum filtro, já que a saída apenas segue a entrada. Os valores úteis estão no meio. Em sistemas pequenos, você escolhe FF para ser 12 N, de modo que o multiplica por FF pode ser realizado como uma mudança direta por N bits. Por exemplo, FF pode ser 116 e multiplicar por FF, portanto, uma mudança direta de 4 bits. Caso contrário, este filtro precisa apenas de uma subtração e de um som, embora os números geralmente sejam mais amplos do que o valor de entrada (mais na precisão numérica em uma seção separada abaixo). Normalmente, tomo as leituras do AD significativamente mais rápidas do que são necessárias e aplico dois desses filtros em cascata. Este é o equivalente digital de dois filtros R-C em série e atenua 12 dBoctave acima da frequência de rolagem. No entanto, para as leituras de AD, geralmente é mais relevante olhar para o filtro no domínio do tempo, considerando sua resposta passo a passo. Isso indica o quão rápido o sistema verá uma mudança quando a coisa que você está medindo muda. Para facilitar a concepção desses filtros (o que significa apenas escolher FF e decidir quantos deles entrar em cascata), uso o meu programa FILTBITS. Você especifica o número de bits de mudança para cada FF na série de filtros em cascata, e ele calcula a resposta de passo e outros valores. Na verdade, eu costumo executar isso através do meu script wrapper PLOTFILT. Isso executa FILTBITS, que faz um arquivo CSV e, em seguida, traça o arquivo CSV. Por exemplo, aqui é o resultado do PLOTFILT 4 4: os dois parâmetros para PLOTFILT significam que haverá dois filtros em cascata do tipo descrito acima. Os valores de 4 indicam o número de bits de mudança para realizar o multiplicar pelo FF. Os dois valores FF são, portanto, 116 neste caso. O rastreamento vermelho é a resposta do passo da unidade, e é o principal aspecto a ser observado. Por exemplo, isso indica que, se a entrada muda instantaneamente, a saída do filtro combinado será fixada em 90 do novo valor em 60 iterações. Se você se preocupa com 95 horas de colonização, então você precisa esperar cerca de 73 iterações e por 50 horas de reposição apenas 26 iterações. O traço verde mostra a saída de um único pico de amplitude total. Isso dá uma idéia da supressão de ruído aleatória. Parece que nenhuma amostra única causará mais de 2,5 mudanças na saída. O traço azul é dar uma sensação subjetiva do que este filtro faz com o ruído branco. Este não é um teste rigoroso, uma vez que não há garantia de que exatamente o conteúdo era dos números aleatórios escolhidos como entrada de ruído branco para esta corrida de PLOTFILT. É só dar-lhe uma sensação áspera de quanto ele será esmagado e quão suave é. PLOTFILT, talvez FILTBITS, e muitas outras coisas úteis, especialmente para o desenvolvimento de firmware PIC, estão disponíveis na versão do software PIC Development Tools na minha página de downloads de software. Adicionado sobre a precisão numérica que vejo a partir dos comentários e agora uma nova resposta que tem interesse em discutir o número de bits necessários para implementar este filtro. Observe que o Multiply by FF criará novos bits do Log 2 (FF) abaixo do ponto binário. Em sistemas pequenos, FF é geralmente escolhido para ser 12 N, de modo que esse multiplicação seja efetivamente realizado por uma mudança direta de N bits. FILT é, portanto, geralmente um inteiro de ponto fixo. Observe que isso não altera nenhuma das matemáticas do ponto de vista dos processadores. Por exemplo, se você estiver filtrando as leituras de AD de 10 bit e N 4 (FF 116), então você precisa de 4 bits de fração abaixo das leituras de AD inteiras de 10 bits. A maioria dos processadores, você estará fazendo operações inteiras de 16 bits devido às leituras AD de 10 bits. Nesse caso, você ainda pode fazer exatamente as mesmas operações de inteiro de 16 bits, mas comece com as leituras de AD esquerda deslocadas em 4 bits. O processador não conhece a diferença e não precisa. Fazer matemática em inteiros inteiros de 16 bits funciona se você considera que eles são 12.4 pontos fixos ou verdadeiros inteiros de 16 bits (16.0 ponto fixo). Em geral, você precisa adicionar N bits cada pólo de filtro se você não deseja adicionar ruído devido à representação numérica. No exemplo acima, o segundo filtro de dois teria que ter 1044 18 bits para não perder informações. Na prática, em uma máquina de 8 bits que significa que você use valores de 24 bits. Tecnicamente, apenas o segundo pólo de dois precisaria do valor mais amplo, mas, para a simplicidade do firmware, costumo usar a mesma representação e, assim, o mesmo código, para todos os pólos de um filtro. Geralmente eu escrevo uma sub-rotina ou macro para executar uma operação de polio de filtro, depois aplique isso a cada pólo. Se uma sub-rotina ou macro depende se os ciclos ou a memória do programa são mais importantes nesse projeto específico. De qualquer forma, eu uso algum estado de rascunho para passar NOVO no subroutinemacro, que atualiza FILT, mas também carrega isso no mesmo estado de rascunho NOVO estava dentro. Isso facilita a aplicação de vários pólos desde que o FILT atualizado de um pólo é o NOVO Do próximo. Quando uma sub-rotina, é útil ter um ponteiro apontar para FILT no caminho, que é atualizado logo após FILT no caminho de saída. Dessa forma, a sub-rotina atua automaticamente em filtros consecutivos na memória se for chamado várias vezes. Com uma macro, você não precisa de um ponteiro, pois você passa no endereço para operar em cada iteração. Exemplos de código Aqui está um exemplo de uma macro como descrito acima para um PIC 18: E aqui está uma macro semelhante para um PIC 24 ou dsPIC 30 ou 33: Ambos esses exemplos são implementados como macros usando o meu pré-processador PIC assembler. Que é mais capaz do que qualquer uma das instalações de macro incorporadas. Clabacchio: Outro problema que eu deveria ter mencionado é a implementação do firmware. Você pode escrever uma sub-rotina de filtro passa-baixa de um único pó uma vez, e depois aplicá-la várias vezes. Na verdade, geralmente escrevo uma sub-rotina para levar um ponteiro na memória para o estado do filtro, então, avance o ponteiro para que possa ser chamado sucessivamente de forma fácil para realizar filtros multipolar. Ndash Olin Lathrop 20 de abril 12 às 15:03 1. Muito obrigado por suas respostas - todos eles. Eu decidi usar este Filtro IIR, mas este Filtro não é usado como um Filtro LowPass Padrão, pois eu preciso usar os Valores de Contador médios e compará-los para detectar Mudanças em um determinado intervalo. Uma vez que estes valores são de dimensões muito diferentes dependendo do hardware que eu queria tomar uma média para poder reagir automaticamente a essas mudanças específicas de hardware. Ndash sensslen 21 de maio 12 às 12:06 Se você pode viver com a restrição de um poder de dois itens a média (ou seja, 2,4,8,16,32 etc.), então a divisão pode ser feita com facilidade e eficiência em uma Micro de baixo desempenho sem nenhuma divisão dedicada porque pode ser feito como uma mudança de bit. Cada turno para a direita é um poder de dois, por exemplo: O OP pensou que ele tinha dois problemas, dividindo-se em um PIC16 e memória para o buffer de anel. Esta resposta mostra que a divisão não é difícil. É certo que não aborda o problema da memória, mas o sistema SE permite respostas parciais, e os usuários podem tirar algo de cada resposta por si mesmos, ou mesmo editar e combinar as respostas de outros. Uma vez que algumas das outras respostas exigem uma operação de divisão, elas são igualmente incompletas, uma vez que não mostram como conseguir isso eficientemente em um PIC16. Ndash Martin 20 de abril 12 às 13:01 Há uma resposta para um verdadeiro filtro de média móvel (aka filtro de caixa) com menos requisitos de memória, se você não se importa com o downsampling. É chamado de filtro integrador-pente em cascata (CIC). A idéia é que você tenha um integrador que você tome diferenças em um período de tempo, e o dispositivo chave de economia de memória é que, por downsampling, você não precisa armazenar todos os valores do integrador. Ele pode ser implementado usando o seguinte pseudocódigo: seu comprimento médio móvel efetivo é decimationFactorstatesize, mas você só precisa manter em torno de amostras estadisticas. Obviamente, você pode obter um melhor desempenho se o seu estadista e decimationFactor forem poderes de 2, de modo que os operadores de divisão e restante sejam substituídos por turnos e máscaras-es. Postscript: Eu concordo com a Olin que você sempre deve considerar filtros IIR simples antes de um filtro de média móvel. Se você não precisar da freqüência-nulos de um filtro de caixa, um filtro passa-baixa de 1 pólo ou 2 pólos provavelmente funcionará bem. Por outro lado, se você estiver filtrando para fins de decimação (tomando uma entrada de alta taxa de amostragem e avaliando-a para uso por um processo de baixa taxa), um filtro CIC pode ser exatamente o que você está procurando. (Especialmente se você pode usar statesize1 e evitar o buffer de toque completamente com apenas um único valor de integrador anterior) Há uma análise aprofundada da matemática por trás do uso do filtro IIR de primeira ordem que Olin Lathrop já descreveu na troca de pilha de processamento de sinal digital (Inclui muitas imagens bonitas.) A equação para este filtro IIR é: Isto pode ser implementado usando apenas números inteiros e sem divisão usando o seguinte código (pode precisar de alguma depuração como eu estava digitando de memória.) Este filtro se aproxima de uma média móvel de As últimas K amostras, definindo o valor de alfa para 1K. Faça isso no código anterior, definindo BITS para LOG2 (K), ou seja, para K 16, defina BITS para 4, para K 4, defina BITS para 2, etc. (Verifique o código listado aqui assim que eu receber uma mudança e Edite esta resposta, se necessário.) Respondeu 23 de junho 12 às 4:04 Heres um filtro passa-baixa de um único polo (média móvel, com freqüência de corte CutoffFrequency). Muito simples, muito rápido, funciona muito bem e quase sem memória. Nota: Todas as variáveis ​​têm um alcance além da função de filtro, exceto o passado em newInput Note: Este é um filtro de estágio único. Múltiplos estágios podem ser conectados em cascata para aumentar a nitidez do filtro. Se você usar mais de um estágio, você precisará ajustar o DecayFactor (como se relaciona com a frequência de corte) para compensar. E, obviamente, tudo que você precisa é que as duas linhas colocadas em qualquer lugar, eles não precisam de sua própria função. Este filtro possui um tempo de aceleração antes que a média móvel represente a do sinal de entrada. Se você precisar ignorar esse tempo de aceleração, basta inicializar o MovingAverage para o primeiro valor do newInput em vez de 0 e espero que o primeiro NewInput não seja um outlier. (CutoffFrequencySampleRate) tem um intervalo entre 0 e 0,5. DecayFactor é um valor entre 0 e 1, geralmente perto de 1. Os flutuadores de precisão única são bons o suficiente para a maioria das coisas, eu apenas prefiro duplas. Se você precisa ficar com números inteiros, você pode converter DecayFactor e Factor de amplitude em inteiros fracionários, nos quais o numerador é armazenado como inteiro e o denominador é uma potência inteira de 2 (para que você possa mudar de bit para a direita como o Denominador em vez de ter que dividir durante o ciclo do filtro). Por exemplo, se DecayFactor 0.99 e você deseja usar números inteiros, você pode definir o DecayFactor 0.99 65536 64881. E então, sempre que você se multiplicar pelo DecayFactor no loop do filtro, basta mudar o resultado 16. Para obter mais informações sobre isso, um excelente livro é esse Online, capítulo 19 em filtros recursivos: dspguidech19.htm PS Para o paradigma da Média em Movimento, uma abordagem diferente para definir DecayFactor e AmplitudeFactor que pode ser mais relevante para suas necessidades, digamos que você quer o anterior, cerca de 6 itens em média juntos, fazendo isso discretamente, você adicionará 6 itens e dividirá por 6, então Você pode configurar o AmplitudeFactor para 16, e DecayFactor para (1.0 - AmplitudeFactor). Respondeu 12 de maio 12 às 22:55 Todos os outros comentaram detalhadamente sobre a utilidade do IIR vs. FIR e sobre a divisão de poder de dois. Eu gostaria de dar alguns detalhes de implementação. O abaixo funciona bem em pequenos microcontroladores sem FPU. Não há multiplicação, e se você mantém N um poder de dois, toda a divisão é de um único ciclo de mudança de bits. Tampão de anel FIR básico: mantenha um buffer de execução dos últimos valores de N e uma SOM em execução de todos os valores no buffer. Cada vez que uma nova amostra vem, subtrair o valor mais antigo no buffer de SUM, substituí-lo pela nova amostra, adicionar a nova amostra a SUM e SOMN de saída. Tampão de anel IIR modificado: mantenha uma SOM executória dos últimos valores de N. Cada vez que uma nova amostra vem, SUM - SUMN, adicione a nova amostra e saia SUMN. Respondeu 28 de agosto 13 às 13:45 Se eu tiver lido você direito, você descreve um filtro IIR de primeiro ordem, o valor que você está subtraindo não é o valor mais antigo que está caindo, mas sim a média dos valores anteriores. Os filtros IIR de primeiro orden certamente podem ser úteis, mas eu não tenho certeza do que você quer dizer quando você sugere que a saída seja a mesma para todos os sinais periódicos. A uma taxa de amostragem de 10KHz, a alimentação de uma onda quadrada de 100Hz em um filtro de caixa de 20 estágios produzirá um sinal que sobe uniformemente para 20 amostras, fica alto por 30, cai uniformemente para 20 amostras e fica com baixo para 30. Uma ordem de primeira ordem Filtro IIR. Ndash supercat 28 de agosto 13 às 15:31 renderá uma onda que começa a subir bruscamente e gradualmente se nivela perto (mas não em) o máximo de entrada, então começa a cair bruscamente e gradualmente nivela perto (mas não at) o mínimo de entrada. Comportamento muito diferente. Ndash supercat 28 de agosto 13 às 15:32 Uma questão é que uma média móvel simples pode ou não ser útil. Com um filtro IIR, você pode obter um bom filtro com relativamente poucos calcs. O FIR que você descreve só pode dar-lhe um retângulo no tempo - um sinc na freq - e você pode gerenciar os lobos laterais. Pode valer a pena lançar alguns números inteiros para tornar uma boa FIR sintonizada simétrica se você pode poupar os tiques do relógio. Ndash Scott Seidman 29 de agosto 13 às 13:50 ScottSeidman: Não há necessidade de se multiplicar se um simplesmente tiver cada estágio da FIR ou produzir a média da entrada para esse estágio e seu valor armazenado anterior, e depois armazenar a entrada (se tiver O intervalo numérico, pode-se usar a soma em vez da média). Se isso é melhor do que um filtro de caixa depende do aplicativo (a resposta de passo de um filtro de caixa com um atraso total de 1 ms, por exemplo, terá um pico d2dt desagradável quando a entrada muda, e novamente 1 ms depois, mas terá o mínimo Possível ddt para um filtro com um atraso total de 1ms). Ndash supercat 29 de agosto às 15:25 Como disse mikeselectricstuff, se você realmente precisa reduzir suas necessidades de memória e você não se importa que sua resposta de impulso seja exponencial (em vez de um pulso retangular), eu iria por um filtro exponencial de média móvel . Eu os uso extensivamente. Com esse tipo de filtro, você não precisa de nenhum buffer. Você não precisa armazenar N amostras passadas. Apenas um. Então, seus requisitos de memória são reduzidos por um fator de N. Além disso, você não precisa de nenhuma divisão para isso. Somente multiplicações. Se você tem acesso à aritmética de ponto flutuante, use as multiplicações de ponto flutuante. Caso contrário, faça multiplicações inteiras e mude para a direita. No entanto, estamos em 2012 e eu recomendaria que você usasse compiladores (e MCUs) que permitem que você trabalhe com números de ponto flutuante. Além de ser mais eficiente e mais eficiente em memória (você não precisa atualizar itens em qualquer buffer circular), eu diria que também é mais natural. Porque uma resposta exponencial de impulso corresponde melhor à maneira como a natureza se comporta, na maioria dos casos. Respondeu 20 de abril 12 às 9:59 Um problema com o filtro IIR como quase tocado por olin e supercat, mas aparentemente desconsiderado por outros é que o arredondamento apresenta alguma imprecisão (e potencialmente biastruncação). Assumindo que N é um poder de dois, e apenas uma aritmética inteira é usada, a direita de mudança elimina sistematicamente os LSBs da nova amostra. Isso significa que, quanto tempo a série possa ser, a média nunca levará em consideração essa série. Por exemplo, suponha uma série que diminua lentamente (8,8,8. 8,7,7,7. 7,6,6) e assume que a média é de fato 8 no início. A amostra do punho 7 trará a média para 7, independentemente da força do filtro. Apenas para uma amostra. A mesma história para 6, etc. Agora pense no contrário. A série sobe. A média permanecerá em 7 para sempre, até que a amostra seja grande o suficiente para fazê-la mudar. Claro, você pode corrigir o viés, adicionando 12N2, mas isso realmente não resolverá o problema de precisão. Nesse caso a série decrescente permanecerá para sempre em 8 até a amostra ser 8-12 (N2). Para N4, por exemplo, qualquer amostra acima de zero manterá a média inalterada. Eu acredito que uma solução para isso implicaria manter um acumulador de LSBs perdidos. Mas eu não consegui o suficiente para ter o código pronto, e não tenho certeza de que isso não prejudicaria o poder do IIR em alguns outros casos de séries (por exemplo, se 7,9,7,9 seria médio para 8). Olin, sua cascata de dois estágios também precisaria de alguma explicação. Você quer dizer segurar dois valores médios com o resultado do primeiro alimentado no segundo em cada iteração. Qual é o benefício disso

No comments:

Post a Comment