دسته بندی بسته ها، پردازشی اساسی در پردازنده های شبکه ای است. در این فرآیند، بسته ها ی ورودی از طریق تطبیق با مجموعه ای از فیلترها به جریان های مشخص طبقه بندی می شوند. پیاده سازی های نرم افزاری الگوریتم های دسته بندی با وجود هزینه کم تر و توسعه پذیری بیش تر نسبت به پیاده سازی های سخت افزاری، سرعت پایین تری دارند. در این رساله، از قابلیت پردازش موازی پردازنده های گرافیکی برای تسریع الگوریتم درخت سلسله مراتبی دسته بندی بسته ها، استفادهنموده و سناریوهای متفاوتی را بر اساس معماری حافظه های سراسری و اشتراکی آن هاپیشنهاد می نماییم. نتایج پیاده سازی این سناریوها، ضمن تأیید پیچیدگی های زمانی و حافظه ای محاسبه شده، نشان می دهد کارایی سناریوهایی که مجموعه فیلتر را به صورت زیردرخت هایی کوچک تر یا مساوی حافظه اشتراکی تقسیم و به آن کپی می کنند کم تر از سناریویی است که کل ساختار داده را در حافظه سراسری نگه می دارد. کارایی این سناریوها، با کاهش تعداد زیردرخت ها و فیلترهای تکراریافزایش می یابد علاوه بر این، سناریویی که بتواند درخت سلسله مراتبی و مجموعه فیلترهای متناظر را، بدون افراز در حافظه اشتراکی جای دهد برترین سناریو است. نتایج آزمایش نشان می دهد که نرخ گذرداد حاصله در این سناریو نسبت به روش-های موجود بر روی یک GPU یکسان تا 2/1 برابر بهبود می یابد