Tensorflow Lite Posenet یا برآورد Pose وظیفه استفاده از یک مدل ML برای برآورد وضعیت شخص از یک تصویر یا فیلم با تخمین مکان های مکانی مفاصل کلیدی بدن (نقاط کلیدی) است.
برآورد ژست به تکنیک های بینایی رایانه ای اطلاق می شود که فیگورهای انسان را در تصاویر و فیلم ها تشخیص می دهد ، بنابراین می توان تعیین کرد که مثلاً آرنج کسی در یک عکس کجا نشان داده می شود. آگاهی از این واقعیت مهم است که تخمین ژست صرفاً تخمین محل اتصال مفصلی بدن است و تشخیص نمی دهد چه کسی در یک تصویر یا فیلم قرار دارد.
مدل PoseNet یک تصویر دوربین پردازشی را به عنوان ورودی می گیرد و اطلاعات مربوط به نقاط کلیدی را خارج می کند. نقاط کلیدی شناسایی شده توسط یک شناسه قسمت نمایه می شوند ، با نمره اطمینان بین 0.0 و 1.0. نمره اطمینان احتمال وجود یک کلید را در آن موقعیت نشان می دهد.
معیارهای عملکرد
عملکرد براساس دستگاه و گام خروجی شما متفاوت است (نقشه های حرارتی و بردارهای افست). مدل PoseNet اندازه تصویر ثابت نیست ، به این معنی که می تواند موقعیت های ژست را در همان مقیاس تصویر اصلی بدون در نظر گرفتن کوچک بودن تصویر پیش بینی کند. این بدان معناست که شما مدل را برای داشتن دقت بالاتری در هزینه عملکرد پیکربندی کرده اید.
گام خروجی تعیین می کند که مقدار خروجی نسبت به اندازه تصویر ورودی کاهش یابد. روی اندازه لایه ها و خروجی های مدل تأثیر می گذارد.
هرچه گام خروجی بالاتر باشد ، وضوح لایه ها در شبکه و خروجی ها کمتر و به همان نسبت دقت آنها نیز کمتر است. در این پیاده سازی ، گام خروجی می تواند مقادیر 8 ، 16 یا 32 داشته باشد. به عبارت دیگر ، گام خروجی 32 باعث سریعترین عملکرد اما کمترین دقت می شود ، در حالی که 8 به بالاترین دقت اما کمترین عملکرد منجر می شود. مقدار شروع توصیه شده 16 است.